Skip to content

Pair programming practice using WebScraping(Beutiful Soup-Selenium), SQL, DataBase

Notifications You must be signed in to change notification settings

AndreaGonzalezG/BBDD_WebScraping_APIs

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Extracción de datos y gestión de bases de datos relacionales

Este repositorio contiene una serie de ejercicios para la extracción de datos utilizando APIs, Web Scraping, para la creación, normalización y gestión de datos en MySQL.

📂 Contenido del repositorio

Los ejercicios se enfocan en el uso de las siguientes características:

  • API's: solicitudes a API's, respuestas JSON e insersión de datos en BBDD.
  • Web Scraping: Extracción de datos de páginas web directamente, utilizando la biblioteca BeautifulSoup.
  • Selenium: Automatización de interacción con sitios web utilizando Selenium.
  • SQL: Extracción de datos de bases de datos relacionales. Consultas en SQL utilizando queries avanzadas

✅ Programas utilizados

Para ejecutar los ejercicios, necesitarás:

  • Python 3.12
  • MySQL Workbench
  • Visual Studio Code
  • Jupyter Notebook

📁 Estructura del repositorio

  • /exercises: Tipo de ejercicios desarrollados
    • 1_CreaciónBBDD_SQL: Creación de BBDD relacional y normalización de datos.
    • 2_Modificación_SQL: Modificación de estructuras de tablas, insersión y manipulación de datos.
    • 3_Joins: Aplicación de joins para la realización de consultas y combinación de datos.
    • 4_Queries_avanzadas: queries básicas y avanzadas.
    • 5_APIs, Beautiful Soup y Selenium: llamadas a APIs, utilización de biblioteca BS y uso de Selenium para la extracción de datos.
  • /solutions: Soluciones detalladas para cada ejercicio.

About

Pair programming practice using WebScraping(Beutiful Soup-Selenium), SQL, DataBase

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published