Una alternativa open source a DeepResearch de OpenAI (200$/mes) que permite investigar cualquier tema y generar documentos de investigación con datos factuales. El proyecto utiliza LangChain y LangGraph junto con modelos LLM de código abierto:
- DeepSeek R1 (8b): Para el análisis y planificación
- Gemma 2 (8b): Para la generación de contenido
- Tavily API: Para búsquedas web eficientes y extracción de contenido
Un sistema avanzado de investigación impulsado por IA que utiliza modelos de lenguaje y búsqueda web para generar documentos de investigación detallados y bien estructurados.
- Investigación Automatizada: Genera documentos de investigación completos a partir de una simple consulta
- Búsqueda Inteligente: Utiliza Tavily API para búsquedas web precisas y relevantes
- Análisis de Brechas: Identifica y llena automáticamente vacíos de información
- Procesamiento Iterativo: Mejora continuamente el contenido mediante múltiples ciclos de análisis
- Interfaz en Tiempo Real: Muestra el progreso de la investigación en tiempo real
- Documentos Estructurados: Genera documentos académicos bien organizados en formato Markdown
- Framework: Next.js 15.1.7 con TypeScript
- UI: Diseño moderno con Tailwind CSS
- Componentes Principales:
ConceptInput
: Entrada de consulta de investigaciónThinkingProcess
: Visualización del proceso en tiempo realResultDisplay
: Presentación del documento finalSourcesList
: Lista de fuentes consultadas
- WebSocket: Comunicación en tiempo real con el backend
- Framework: Express.js con TypeScript
- Características Principales:
- WebSocket Server para actualizaciones en tiempo real
- Sistema de procesamiento basado en grafos
- Integración con múltiples APIs de IA
-
PlanResearchBrain:
- Optimiza la consulta de investigación
-
TavilySearchTool:
- Realiza búsquedas web precisas
- Recopila información relevante
-
SummarizeContentBrain:
- Genera resúmenes coherentes
- Integra nueva información con contenido existente
-
AnalyzeGapsBrain:
- Identifica brechas de conocimiento
- Genera consultas de seguimiento
-
GenerateStructureBrain:
- Crea estructuras de documentos jerárquicas
- Organiza el contenido lógicamente
-
GenerateDocumentBrain:
- Produce documentos académicos completos
- Aplica estándares de escritura académica
-
Planificación:
- El usuario ingresa una consulta de investigación
- El sistema genera un plan de búsqueda optimizado
-
Búsqueda y Análisis:
- Búsqueda web mediante Tavily API
- Generación de resúmenes del contenido encontrado
- Análisis de brechas de conocimiento
- Búsquedas adicionales según sea necesario
-
Generación de Documentos:
- Creación de estructura jerárquica
- Generación de contenido detallado
- Formateo en Markdown académico
- Next.js 15.1.7
- React 19.0.0
- TypeScript
- Tailwind CSS
- React Markdown
- WebSocket Client
- Node.js
- Express
- TypeScript
- LangChain
- Ollama
- Tavily API
- WebSocket Server
- Node.js (versión LTS)
- Ollama instalado y ejecutándose localmente
- Clave API de Tavily
NEXT_PUBLIC_WS_URL=ws://localhost:5000
PORT=5000
NODE_ENV=development
API_PREFIX=/api/v1
OLLAMA_BASE_URL=http://localhost:11434
TAVILY_API_KEY=your_tavily_api_key_here
GENERATION_MODEL=gemma2
THINKING_MODEL=deepseek-r1:8b
MAX_ANALYSIS_COUNT=2
MAX_RESULTS=1
- Backend
cd backend
npm install
npm run dev
- Frontend
cd frontend
npm install
npm run dev
- Accede a la aplicación web (por defecto en http://localhost:3000)
- Ingresa tu consulta de investigación en el campo de entrada
- El sistema comenzará automáticamente el proceso de investigación
- Observa el progreso en tiempo real
- Recibe el documento final en formato Markdown
Las contribuciones son bienvenidas. Por favor, sigue estos pasos:
- Fork el repositorio
- Crea una rama para tu feature (
git checkout -b feature/AmazingFeature
) - Commit tus cambios (
git commit -m 'Add some AmazingFeature'
) - Push a la rama (
git push origin feature/AmazingFeature
) - Abre un Pull Request
Este proyecto formó parte del workshop "Creación de agentes de IA con Langchain.js" presentado en la JSConf España 2025, organizada por midudev y powered by KeepCoding.
El workshop se llevó a cabo el 1 de marzo de 2025 en La Nave, Madrid, donde los asistentes aprendieron a:
- Implementar las bibliotecas de código abierto de Langchain.js para Node.js
- Integrar modelos de IA generativa
- Ejecutar agentes de IA de manera independiente
Para más información sobre la conferencia, visita JSConf España 2025.
Este proyecto está bajo la licencia ISC. Ver el archivo LICENSE
para más detalles.
- Tavily API por el motor de búsqueda
- Ollama por los modelos de IA locales
- LangChain por el framework de IA