Skip to content

Commit

Permalink
Update index.html
Browse files Browse the repository at this point in the history
  • Loading branch information
mauricioarcez authored Jan 7, 2025
1 parent 20712e3 commit ad6e6b8
Showing 1 changed file with 20 additions and 13 deletions.
33 changes: 20 additions & 13 deletions index.html
Original file line number Diff line number Diff line change
Expand Up @@ -32,7 +32,7 @@ <h1>Bienvenido, soy <strong>Mauricio.</strong> <br />
<header class="major">
<h2>Sobre Mi.</h2>
</header>
<p><b>Ingeniero-Analista de Datos</b> con background en Economía, lo que me permite analizar datos con un enfoque orientado al negocio. Cuento con experiencia en Big Data con PySpark, en machine learning y NLP. Tengo habilidades sólidas en estructura y modelado de datos, desarrollo de pipelines ETL, así como en almacenamiento y optimización de datos en la nube, Con especialización en Google Cloud Platform (GCP) y conocimientos en AWS y Azure. Poseo experiencia en orquestación de datos utilizando Airflow y generación de reportes estadísticos con herramientas como Power BI, Looker Studio y Plotly. Además, domino SQL, Python y Pandas, con más de 2 años de experiencia práctica.
<p><b>Ingeniero-Analista de Datos</b> con background en Economía, lo que me permite analizar datos con un enfoque orientado al negocio. Cuento con experiencia en Big Data con PySpark y Hadoop, en machine learning y NLP. Tengo habilidades sólidas en estructura y modelado de datos, desarrollo de pipelines ETL, así como en almacenamiento y optimización de datos en la nube, Con especialización en Google Cloud Platform (GCP) y conocimientos en AWS y Azure. Poseo experiencia en orquestación de datos utilizando Airflow y generación de reportes estadísticos con herramientas como Power BI, Looker Studio y Plotly. Además, domino SQL, Python y Pandas, con más de 2 años de experiencia práctica.
En el ámbito colaborativo, destaco por mi capacidad de resolución de problemas complejos, adaptabilidad para aprender rápidamente nuevas tecnologías o metodologías, y comunicación efectiva para traducir resultados técnicos en insights claros para la toma de decisiones.</p>
<ul class="actions">
<li><a href="#two" class="button">Ver Mi Experiencia
Expand All @@ -50,9 +50,14 @@ <h2>Proyectos recientes</h2>

<a href="images/fulls/1.png" target="_blank" class="image fit thumb"><img src="images/thumbs/Dashboard_general.png" alt="Dashboard" /></a>
<h3>DataPulse: Reseñas y Recomendaciones.</h3>
<p>Trabajé en la implementación de un <b>pipeline ETL automatizado</b> en la nube de Google Cloud para procesar datos de reseñas de GoogleMaps, incluyendo su extracción, limpieza y modelado de <b>Base de datos</b>. Diseñé y optimicé un modelo de <b>análisis de sentimiento</b>, y desarrollé un <b>dashboard interactivo</b> para visualizar resultados clave y facilitar la toma de decisiones en el sector de restaurantes en Estados Unidos.</p>
<p>Consultoría de análisis de sentimiento para negocios gastronómicos, diseñando y gestionando un Data Warehouse, Pipelines ETL automatizados y Data Marts para visualización y Machine Learning.
Automatización de procesos en Airflow con Cloud Functions transformando un proceso manual en un flujo completamente automatizado, reduciendo errores humanos y optimizando los tiempos de procesamiento.
Integración de múltiples fuentes de datos al DW, incluyendo Google Maps y Yelp, para estructurar y enriquecer la información de reseñas, dividiendo luego la información en distintos datamarts.
Visualización de datos en Power BI, para destacar métricas y mejorar la claridad de los datos.Modelado de datos utilizando un modelo copo de nieve para el DW y optimizar el almacenamiento, y un modelo estrella para los datamarts de reporting y ML optando por la velocidad de consultas.
Monitoreo de rendimiento con BigQuery Execution Plan evaluando métricas de rendimiento como el tiempo de ejecución, bytes procesados, complejidad de la consulta, particiones y clustering de tablas.
</p>

<p style="margin-top: 15px;"><strong>#Airflow #BigQuery #Composer #SentimentAnalysis #StorytellingVisual #PowerBI #DAX #Cloud Storage #ETL #EDA #KPIs</strong></p>
<p style="margin-top: 15px;"><strong>#Airflow #BigQuery #CloudFunctions #SentimentAnalysis #StorytellingVisual #PowerBI #DAX #CloudStorage #ETL #EDA #KPIs</strong></p>
<ul class="actions" style="margin-top: 15px;">
<li><a href="https://github.com/mauricioarcez/DataPulse_Gmaps_Yelp" target="_blank" class="button">Ver Proyecto</a></li>
</ul>
Expand All @@ -61,11 +66,13 @@ <h3>DataPulse: Reseñas y Recomendaciones.</h3>
<article class="col-6 col-12-xsmall work-item">
<a href="images/fulls/pag1.png" class="image fit thumb"><img src="images/thumbs/kpi.png" alt="KPIs" /></a>
<h3>ENACOM Internet Argentina</h3>
<p>
Trabajé en el <b>análisis del comportamiento de servicios de internet en Argentina</b> a nivel nacional, recopilando información de diversas fuentes, incluyendo <b>INDEC</b>.
Realicé un <b>análisis exploratorio de datos (EDA)</b> para identificar tendencias y patrones en el uso de tecnologías y velocidades de conexión, mejorando la calidad del análisis en un <b>70%</b> en términos de precisión y comprensión.
Además, desarrollé <b>KPIs</b> y métricas personalizadas utilizando <b>DAX</b>, diseñando un storytelling visual con <b>Power BI</b> para facilitar decisiones basadas en datos.
<p style="margin-top: 15px;"><strong>#EDA #StorytellingVisual #ETL #PowerBI #DAX #Pandas #Python #PowerQuery #Excel #KPIs</strong></p>
<p>Análisis del comportamiento de servicios de internet en Argentina a nivel nacional. con el objetivo de identificar tendencias clave y oportunidades de mejora.
Integre múltiples fuentes de datos, incluyendo INDEC y ENACOM, para estructurar y enriquecer la información.
Realicé un ETL para transformar faltantes y errores de datos en el uso de tecnologías y velocidades de conexión, mejorando la unicidad del análisis en un 70% en términos de duplicidad, claves primarias, foráneas y consultas.
Creación de stored procedures para automatizar procesos y mejorar la eficiencia en la manipulación y transformación de los datos dentro de la base de datos.
Optimizar el rendimiento de las consultas en SQL Server mediante el uso de índices DBCC y Execution Plan para el análisis de la base de datos y el ajuste de rendimiento.
Visualización de datos en Power BI, para medir KPIs accionables de los datos.
<p style="margin-top: 15px;"><strong>#EDA #StorytellingVisual #ETL #PowerBI #DAX #Pandas #Python #PowerQuERY #DBCC #Excel #KPIs</strong></p>
</p>
<ul class="actions" style="margin-top: 15px;">
<li><a href="https://github.com/mauricioarcez/Analisis-de-Mercado-Internet-Arg" target="_blank" class="button">Ver Proyecto</a></li>
Expand All @@ -75,11 +82,11 @@ <h3>ENACOM Internet Argentina</h3>
<article class="col-6 col-12-xsmall work-item">
<a href="images/fulls/recclick.png" class="image fit thumb"><img src="images/thumbs/recminion.png" alt="recomendacion" /></a>
<h3>API Modelo de recomendación de peliculas</h3>
<p>
Desarrollé una <b>API para recomendar películas</b> basada en similitudes del coseno y técnicas avanzadas de <b>procesamiento de lenguaje natural (NLP)</b>.
Implementé un <b>pipeline de procesamiento de texto</b> que incluye normalización, lematización, expresiones regulares stopwords y vectores <b>TF-IDF</b> para optimizar la preparación de datos textuales y mejorar la precisión de las recomendaciones.
Utilicé el formato <b>Parquet</b> para optimizar el almacenamiento, reduciendo significativamente el espacio requerido y acelerando el procesamiento.
Desplegué la API con <b>FastAPI</b>, consumida por una interfaz web en <b>Render</b>, ofreciendo recomendaciones en tiempo real con información detallada de películas y actores.
<p>Desarrolle una API para recomendar películas basada en similitudes del coseno y técnicas avanzadas de procesamiento de lenguaje natural (NLP).
Implemente un ETL para mejorar la unicidad y claridad de los datos hacia la API. Tratando valores faltantes con técnicas de ML. Procesamiento de texto con normalización, lematización, expresiones regulares y vectores TF-IDF para preparar los datos textuales de las películas y mejorar la calidad de las recomendaciones.
Desplegué una API en FastAPI, consumida por una interfaz web, para ofrecer recomendaciones en tiempo real con información detallada de películas y actores.
Optimice el almacenamiento con almacenamiento columnar, mejorando la velocidad de consultas de la API.

<p style="margin-top: 15px;"><strong>#NLP #TFIDF #FastAPI #Scikit-Learn #TruncatedSVD #Render #RecomendadorDePelículas #Parquet #MachineLearning</strong></p>
</p>
<ul class="actions" style="margin-top: 15px;">
Expand Down

0 comments on commit ad6e6b8

Please sign in to comment.