Descripción: Investigación y examinación exhaustiva del panorama de las salas de cine en Argentina. Se exploraron los datos usando técnicas de ciencia de datos y análisis estadístico, investigando variables como: ubicación geográfica, cantidad de pantallas, y cadena de cine para obtener información sobre la industria cinematográfica en el país. También se crearon visualizaciones de los datos usando gráficos y mapas interactivos.
Herramientas: Python, Pandas, Numpy, y SQL (SQLite) para el análisis y manipulación de los datos. Matplotlib, Seaborn y Folium para representación de los datos. Se usaron las librerías Scikit-learn y statsmodels para la sección de aprendizaje automatico. Como entorno, se útilizo Jupyter Labs.
Fecha de creación: 29-05-2023
Enlaces:
Descripción: En este proyecto, realice un análisis de datos textuales con herramientas de Procesamiento de Lenguaje Natural (PLN) utilizando Python y distintas librerias de ciencia de datos. Se completo un análisis detallado del texto titulado "I want to open a window in their souls" del autor Haruki Murakami. Se aplicaron técnicas de raspado web, análisis de palabras frecuentes, visualizaciones de datos y modelos de lenguaje de gran tamaño (LLM) para extraer información y comprender el contenido del artículo.
Herramientas: Librerias BeautifulSoup y requests para el raspado web y la extracción de datos textuales. Transformers de Hugging Face para modelos de lenguage de gran tamaño (LLM) y Matplotlib para visualizaciónes. Libreria Pandas, Counter, y regular expressions (re) para manipulación, procesamiento y análisis de los datos. Cómo entorno se uso Google Colab (por motivo de recursos computacionales).
Fecha de creación:
Enlaces:
- Ver el cuaderno en Jupyter Nbviewer
- Ver el cuaderno en Google Colab
- Repositorio en GitHub
- Primer versión (inglés)
Perfil de LinkedIn: LinkedIn