Agente ‘News Hunter’: monitorización automática de noticias
⏱ 15 min de lectura • 🚀 Nivel: Estratega
«Hoy vamos a diseñar juntos un agente muy específico dentro de una máquina de contenidos: el ‘News Hunter’, o cazador de noticias. Su trabajo no es escribir artículos ni hacer magia creativa. Su trabajo es ayudarte a automatizar la búsqueda de información relevante para tu negocio, filtrar ruido y dejarte una bandeja ordenada de ideas y noticias listas para usar en otros procesos: redacción, newsletters, análisis de competencia o vigilancia sectorial. Piensa en él como el agente de investigación que trabaja en segundo plano para que tus otros agentes de contenido nunca se queden sin materia prima. En esta lección no vamos a entrar en prompts complejos ni en copywriting. Nos centramos en algo más básico pero crítico: captación estructurada de información, enriquecimiento mínimo con IA y almacenamiento limpio para reutilizar después.»
🎬 Blueprint de la Lección
1. Objetivo de la lección
Al finalizar esta lección, serás capaz de definir y montar un primer News Hunter operativo que: consulte fuentes de noticias predefinidas sobre tu nicho, aplique filtros básicos para reducir ruido, añada un paso de enriquecimiento con IA (resumen, etiquetas y puntuación de relevancia) y persista los resultados en un repositorio de ideas utilizable (hoja de cálculo, Notion, Airtable). Es decir: que pases de ‘buscar noticias a mano’ a tener un flujo automático, ejecutándose solo, que te deja todo preparado para el siguiente agente.
2. Definición del agente News Hunter
Un News Hunter es un agente de investigación que recopila noticias recientes sobre temas definidos, opera de forma periódica, sigue reglas explícitas (keywords, dominios, idioma) y devuelve salidas estructuradas (título, URL, resumen, etiquetas, relevancia). Importante: no decide la línea editorial, solo prepara la materia prima informativa.
3. Especificación Funcional (Inputs & Outputs)
INPUTS: Lista de fuentes (RSS, APIs), Keywords (5-10 palabras clave), Frecuencia (diaria/semanal), Idioma/Dominios. OUTPUTS: Registros con Fecha, Fuente, Título, URL, Resumen IA, Tags, Puntuación (1-5). USOS: Contenido editorial, Newsletters, Análisis de competencia, Vigilancia sectorial.
4. Arquitectura y flujo en Make / n8n
1. Trigger (Planificador horario). 2. Ingesta (RSS/HTTP/Scraping). 3. Normalizador (Formato común). 4. Filtro previo (Reglas deterministas). 5. Enriquecimiento IA (OpenAI recibe título/texto y devuelve JSON con resumen, tags, relevancia). 6. Almacenamiento (Sheets/Notion, evitando duplicados). 7. Notificación (Digest opcional).
«Con este agente News Hunter ya tienes cubierto algo fundamental: tu sistema de contenidos deja de depender de que alguien se siente cada mañana a ‘buscar qué ha pasado’. A partir de ahora las noticias llegan solas, están normalizadas, enriquecidas con IA y guardadas en un repositorio central. En la próxima lección, C4L2, usaremos este material para el Agente Redactor SEO, completando un pipeline de contenido casi totalmente automatizado.»
🎨 Dirección de Arte AI
Lección Completa
Agente ‘News Hunter’: Scrapeo de noticias automático
## 1. Apertura e introducción
Hoy vamos a diseñar juntos un agente muy específico dentro de una máquina de contenidos: el “News Hunter”, o cazador de noticias. Su trabajo no es escribir artículos ni hacer magia creativa. Su trabajo es rastrear fuentes, filtrar ruido y dejarte una bandeja ordenada de ideas y noticias listas para usar en otros procesos: redacción, newsletters, análisis de competencia o vigilancia sectorial. Piensa en él como el agente de investigación que trabaja en segundo plano para que tus otros agentes de contenido nunca se queden sin materia prima. En esta lección no vamos a entrar en prompts complejos ni en copywriting. Nos centramos en algo más básico pero crítico: captación estructurada de información, enriquecimiento mínimo con IA y almacenamiento limpio para reutilizar después.
—
## 2. Objetivo de la lección
Al terminar esta lección, quiero que seas capaz de definir y montar un primer News Hunter operativo que:
– Consulte fuentes de noticias predefinidas sobre tu nicho.
– Aplique filtros básicos para reducir ruido.
– Añada un paso de enriquecimiento con IA: resumen, etiquetas y puntuación de relevancia.
– Y persista los resultados en un repositorio de ideas utilizable: una hoja de cálculo, Notion, Airtable o una base de datos.
Es decir: que pases de “buscar noticias a mano” a tener un flujo automático, ejecutándose solo, que te deja todo preparado para el siguiente agente.
—
## 3. Bloque 1 · Definición del agente News Hunter
Vamos a ponerle definición formal. Un News Hunter es un agente de investigación que:
– Recopila noticias o artículos recientes sobre un conjunto de temas y sectores definidos.
– Opera de forma periódica: cada día, varias veces al día o con la frecuencia que tú definas.
– Sigue reglas explícitas:
– palabras clave,
– dominios a incluir o excluir,
– idioma,
– límites por fuente.
– Y devuelve salidas estructuradas, no texto suelto:
– título,
– URL,
– resumen breve,
– etiquetas o temas,
– puntuación de relevancia para tu negocio.
Muy importante: Este agente no decide la línea editorial ni redacta artículos completos. Su rol es preparar la “materia prima informativa” dentro de tu sistema.
—
## 4. Bloque 2 · Especificación funcional
Ahora bajamos a la ficha técnica: inputs, outputs y restricciones.
#### 4.1 Inputs del agente
Lo mínimo que necesitas para configurar un News Hunter:
– Lista de fuentes
– Feeds RSS de medios.
– APIs de noticias o buscadores especializados.
– Webs concretas donde, si no hay RSS ni API, tirarás de scraping.
– Keywords o expresiones
– De 5 a 10 palabras o frases que definan qué te interesa: por ejemplo, “SaaS B2B”, “retención de clientes”, “ecommerce DTC”, “IA para marketing”.
– Frecuencia de ejecución
– ¿Cada cuánto debe salir a cazar?
– Diario, varias veces al día, semanal… según tu caso de uso.
– Idioma y dominios
– Idioma objetivo de las noticias.
– Dominios a incluir o excluir (por ejemplo, evitar agregadores de baja calidad).
#### 4.2 Outputs
Cada ejecución del agente debe producir un conjunto de registros, donde cada noticia tenga al menos:
– Fecha de captura.
– Fuente o medio.
– Título.
– URL.
– Resumen breve generado por IA.
– Temas principales o etiquetas.
– Puntuación de relevancia en una escala simple, por ejemplo de 1 a 5.
Con esto ya puedes:
– Priorizar qué leer.
– Pasar solo lo relevante al siguiente agente.
– Revisar qué fuentes están aportando más valor.
#### 4.3 Casos de uso típicos
¿Para qué se usa realmente un News Hunter?
– Contenido editorial y blogs: rellenar tu backlog de ideas con noticias frescas.
– Newsletters: tener un pool de enlaces y resúmenes listos para curación de contenidos.
– Análisis de competencia: seguir lanzamientos, rondas de financiación o movimientos estratégicos.
– Vigilancia sectorial: detectar tendencias, cambios regulatorios o nuevas tecnologías en tu nicho.
#### 4.4 Requisitos no funcionales
Además de “que funcione”, queremos que funcione bien:
– Estabilidad: si una fuente falla un día, el flujo no debe caerse entero.
– Escalabilidad: poder añadir o quitar fuentes sin reescribir todo el escenario.
– Trazabilidad: que siempre puedas responder a:
– “¿De dónde salió esta noticia?”
– “¿Cuándo la capturó el agente?”
—
## 5. Bloque 3 · Arquitectura y flujo en Make / n8n
Ahora vamos a ver el flujo lógico típico en una herramienta no-code como Make o n8n. No buscamos que memorices cada parámetro. Queremos que tengas clara la secuencia de módulos que convertirás en realidad en la práctica.
#### 5.1 Visión general del flujo
La arquitectura lógica se puede resumir así:
1. Trigger de tiempo o RSS
– Un planificador que decide cuándo corre el agente.
– Ejemplo: todos los días a las 07:00.
2. Módulos de ingesta (Collector)
– Módulos RSS para feeds.
– Módulos HTTP o conectores para APIs de noticias.
– Conectores de scraping cuando no hay RSS ni API.
3. Normalizador
– Todas las fuentes devuelven datos distintos.
– Aquí los conviertes en un formato común: título, enlace, fragmento, fuente, fecha.
4. Filtro previo
– Reglas deterministas para recortar ruido:
– idioma,
– dominios permitidos,
– exclusión de ciertas palabras,
– máximo de elementos por fuente.
5. Enriquecimiento con IA
– Módulo de IA (OpenAI u otro) que recibe por noticia:
– Título.
– Descripción o fragmento.
– Palabras clave de negocio.
– Y devuelve en JSON:
– resumen en 2–3 frases,
– lista de temas/etiquetas,
– puntuación de relevancia.
6. Almacenamiento
– Inserción en tu repositorio:
– Google Sheets, Notion, Airtable, base de datos, lo que uses.
– Con lógica básica para evitar duplicados por URL reciente.
7. Notificación opcional
– Un digest con las noticias por encima de cierto umbral de relevancia.
– Enviado por email, Slack u otro canal, para revisión rápida humana.
#### 5.2 Detalle paso a paso (sin entrar en parámetros finos)
– Trigger
– En Make/n8n: módulo de “Schedule” o “Cron” configurado con la frecuencia que definiste.
– Alternativa: algunos conectores RSS permiten trigger “nuevo ítem”.
– Ingesta desde múltiples fuentes
– Para cada fuente:
– Si tiene RSS: módulo RSS.
– Si tiene API: módulo HTTP con query, idioma, fecha mínima, etc.
– Si sólo hay web: módulo de scraping o servicio externo.
– Luego se unifican en una misma colección.
– Filtrado previo
– Puedes implementar:
– Filtro por idioma.
– Inclusión/exclusión de dominios.
– Límite máximo de items por fuente y por ejecución.
– Llamada a IA
– Módulo de IA que reciba:
– título,
– descripción,
– palabras clave de negocio.
– Prompt para que devuelva:
– resumen breve,
– etiquetas,
– relevancia 1–5,
– todo en JSON bien formado para poder parsearlo fácilmente.
– Persistencia
– Por cada noticia enriquecida:
– comprobar si la URL ya existe recientemente,
– si no, crear un nuevo registro con todos los campos:
– fecha, fuente, título, URL, resumen, etiquetas, relevancia.
– Digest y notificación (opcional)
– Filtras sólo noticias con relevancia por encima de un umbral, por ejemplo ≥ 4.
– Generas un pequeño resumen: “Hoy se han detectado X noticias relevantes. Aquí tienes las top 5.”
– Y lo envías a tu canal preferido.
—
## 6. Cierre y transición
Con este agente News Hunter ya tienes cubierto algo fundamental: tu sistema de contenidos deja de depender de que alguien se siente cada mañana a “buscar qué ha pasado”. A partir de ahora:
– las noticias llegan solas,
– están normalizadas,
– enriquecidas con IA,
– y guardadas en un repositorio central, listas para ser usadas por otros agentes.
En la próxima lección, C4L2, vamos a coger precisamente este material —las noticias capturadas por tu News Hunter— y construiremos sobre él un agente redactor SEO que transforme esas ideas en contenidos publicables.
## Tarea práctica: Diseño funcional de tu agente “News Hunter”
1. Elige nicho y keywords.
– Define el tema central.
– Selecciona 5-10 palabras clave que el agente debe buscar.
2. Define 3–5 fuentes.
– Busca los RSS de tus medios favoritos o identifica las URLs clave.
3. Completa la plantilla de especificación.
– Inputs (Fuentes, keywords, frecuencia).
– Outputs (Qué datos quieres guardar).
– Restricciones (Idioma, dominios excluidos).
4. Dibuja el diagrama lógico.
– Esboza en papel o Figma los pasos: Trigger -> Ingesta -> Filtro -> IA -> Guardar.
Si tu documento es lo bastante claro como para que otra persona pueda implementarlo en Make o n8n sin hacerte preguntas, habrás cumplido el objetivo de esta lección.
🚀 ACCIÓN DE HOY
Tarea práctica: Diseña la especificación de tu agente ‘News Hunter’.
Deja una respuesta