Este projeto utiliza o Star Schema para organizar dados da PNAD em um Data Warehouse, otimizando análises e relatórios sobre a pandemia COVID-19.
A estrutura do banco de dados é composta por uma tabela de fato central e dimensões diversas, refletindo diferentes aspectos da pandemia:
- Dimensão Saúde: Sintomas e Vacinação.
- Dimensão Trabalho: Informações sobre emprego e atividade econômica.
- Dimensão População: Dados demográficos.
- Dimensão Economia: Indicadores econômicos.
- Dimensão Comportamento: Atitudes durante a pandemia.
Query_Dimension_Fact_Staging.sql
- Script SQL para estruturação do DW.ETL_PnadCovid.ipynb
- Jupyter Notebook detalhando o processo de ETL com Python.
Identificamos padrões críticos e tendências através de uma análise detalhada de variáveis selecionadas, usando métodos estatísticos e preditivos.
Utilizamos regressão logística para examinar a relação entre sintomas e variáveis demográficas e econômicas.
Prepare-se para futuros desafios com nossas recomendações estratégicas.
- Triagem Diferenciada: Adapte a triagem baseada em idade e condições de moradia.
- Apoio Socioeconômico: Atenda as necessidades dos mais vulneráveis.
- Monitoramento e Educação: Eduque sobre prevenção e manejo de sintomas.
Este projeto foi desenvolvido para fornecer insights valiosos para a preparação de hospitais e instituições de saúde em resposta à COVID-19.
- ![Cor Bege]
#E8D9C6
- ![Cor Azul Escuro]
#486773
- ![Cor Azul Claro]
#7AB0C2
- ![Cor Cinza Azulado]
#B9C3C2
This project uses the Star Schema to organize PNAD data into a Data Warehouse, optimizing analyses and reports on the COVID-19 pandemic.
The database structure consists of a central fact table and several dimensions, reflecting different aspects of the pandemic:
- Health Dimension: Symptoms and Vaccination.
- Work Dimension: Employment and economic activity information.
- Population Dimension: Demographic data.
- Economic Dimension: Economic indicators.
- Behavior Dimension: Attitudes during the pandemic.
Query_Dimension_Fact_Staging.sql
- SQL script for DW structuring.ETL_PnadCovid.ipynb
- Jupyter Notebook detailing the ETL process using Python.
We identified critical patterns and trends through a detailed analysis of selected variables, using statistical and predictive methods.
We used logistic regression to examine the relationship between symptoms and demographic and economic variables.
Prepare for future challenges with our strategic recommendations.
- Differentiated Screening: Adapt screening based on age and living conditions.
- Socioeconomic Support: Meet the needs of the most vulnerable.
- Monitoring and Education: Educate on prevention and management of symptoms.
This project was developed to provide valuable insights for the preparation of hospitals and health institutions in response to COVID-19.
- ![Beige Color]
#E8D9C6
- ![Dark Blue Color]
#486773
- ![Light Blue Color]
#7AB0C2
- ![Bluish Gray Color]
#B9C3C2