Este proyecto tiene como objetivo analizar y optimizar la gestión del talento en una empresa. Utilizamos un dataset de recursos humanos para realizar diversas transformaciones y análisis de datos, incluyendo la imputación de valores nulos, la homogeneización de columnas y la creación de una base de datos para almacenar la información procesada.
- ejercicio_proyecto.ipynb: Notebook principal donde se realizan las transformaciones y análisis de datos.
- df_columnas_renombradas.csv: Dataset con las columnas renombradas.
- df_transformacion_datos.csv: Dataset con los datos transformados.
- README.md: Este archivo, que describe el proyecto y cómo ejecutarlo.
- Python 3.7+
- Jupyter Notebook
- Pandas
- NumPy
- Matplotlib
- Seaborn
- SciPy
- MySQL Connector
- Clonar el repositorio:
git clone https://github.com/tu_usuario/tu_repositorio.git
- Navegar al directorio del proyecto:
cd tu_repositorio
- Instalar las dependencias:
pip install -r requirements.txt
- Abrir el notebook en Jupyter:
jupyter notebook ejercicio_proyecto.ipynb
- Ejecutar las celdas del notebook para realizar las transformaciones y análisis de datos.
- Distribución de Género: Análisis de la distribución de género en la empresa.
- Imputación y Detección de Valores Nulos: Imputación de valores nulos en variables numéricas y categóricas.
- Identificacion y detección Valores Duplicados: No se detectaron valores duplicados.
- Homogeneización de Columnas: Renombrado y limpieza de nombres de columnas.
- Creación de Base de Datos: Creación de una base de datos MySQL para almacenar la información procesada.
- Visualizaciones: Histplot, Boxplot y Barplot para apoyar los resultados.
- Julia Marín
- Alba Ventas
- Oriana Salazar
- Mónica García
Las contribuciones son bienvenidas. Por favor, abre un issue o envía un pull request para discutir cualquier cambio que desees realizar.
Data Queens
- Rol: ANALYST
- Email: administracion@dataqueens.com
- Twitter: @dataqueens
- Ubicación: Madrid
- Teléfono: +34 555 55 55 55