Skip to content

Latest commit

 

History

History
25 lines (19 loc) · 1.34 KB

listtodo.md

File metadata and controls

25 lines (19 loc) · 1.34 KB

Ideias e Recursos

Servers e Hosts

  • fly.io;
  • vercel;
  • railway.
  • KingHost
  • Oracle Server (Cloud/VPN)

Features (Mais recursos para o crawler e bot)

  • Get "Top Stories", some news, from page AP News (Assocciated Press)

  • Adicionar notícias do portal do Jornal "Folha de São Paulo".

  • Adicionar o site de noticias e negócios Epoca Negócios/Globo (https://epocanegocios.globo.com/)

  • Implementar o agendamento da mensagem de notíticia do dia. (usar modulo de agendamento de tarefa e de manipulação de data e hora(exemplo sched, e datetime para agendamentos e data/hora respectivamente). Usando Rocketry.

  • Cria banco de dado para salvar link/dados das notícias.

  • Implementada função simples de busca por noticias por palavra-chave ou título de notícia.

  • Adicionado site de noticias da TV Band.

  • Uso de programação assincrona na execução de tarefas do bot (módulo asyncio, vide doc do python ).* [em analise]*

  • Dados salvos no formato json, csv e xlsx.

  • Criar uma classe base mais genérica que modela o crawler e scrapper.

  • Refatoração Etapa 1: Rescrita dos módulo crawler e criação do módulo tracker contendo funções para tratar conteúdo de cada site em especifico (no momento a saber BBC Brasil, Band, CNN Brasil, G1/Globo).