Ir al contenido principal

Metodología

1. Obtención de datos

CODA utiliza scrapers automáticos que descargan archivos de datos directamente desde los portales de instituciones gubernamentales. La fuente principal es el Banco Central de la República Dominicana (BCRD), que publica archivos Excel en su CDN con datos de inflación, tipo de cambio, PIB, remesas, reservas internacionales, tasas de interés y otros indicadores macroeconómicos.

Cada scraper está configurado con la URL exacta de la fuente, el formato del archivo y las reglas de parseo específicas para cada estructura de datos. Los scrapers calculan un hash MD5 del archivo descargado y solo procesan los datos cuando detectan un cambio — esto evita duplicación y reduce la carga sobre los servidores de las instituciones.

2. Procesamiento

Los archivos Excel del BCRD tienen estructuras diversas: algunos tienen años como columnas, otros como filas; algunos tienen datos mensuales, otros trimestrales. Cada parser está diseñado para la estructura específica de su archivo fuente.

Los datos procesados se almacenan en una base de datos PostgreSQL con un esquema normalizado: cada valor está vinculado a un indicador específico y tiene una fecha precisa. Esto permite consultas históricas consistentes independientemente de cómo estaban organizados los datos originales.

3. Generación de artículos

Los artículos de CODA son generados por un agente de inteligencia artificial que recibe los datos procesados junto con lineamientos editoriales estrictos. El agente selecciona el tipo de gráfica más apropiado para cada insight y produce la narrativa completa.

Cada artículo generado pasa por un validador automático que verifica:

  • Ausencia de menciones a partidos políticos o funcionarios
  • Ausencia de emojis o lenguaje informal
  • Diversidad de tipos de gráficas (mínimo 3 tipos diferentes en artículos largos)
  • Que cada gráfica tenga contexto narrativo alrededor
  • Extensión mínima de narrativa (800+ palabras)

4. Actualización automática

Cuando un scraper detecta datos nuevos, los artículos vinculados a esos indicadores se marcan para regeneración. Esto significa que si el BCRD publica nueva data de inflación, el artículo sobre inflación se actualiza automáticamente con las cifras más recientes.

Las gráficas dentro de los artículos siempre muestran datos en tiempo real desde la base de datos — no son imágenes estáticas. Si un dato cambia, la gráfica refleja el cambio inmediatamente.

5. Limitaciones

CODA depende de la disponibilidad y calidad de los datos publicados por las instituciones gubernamentales. Si una fuente deja de publicar o cambia el formato de sus archivos, los datos afectados no se actualizarán hasta que el scraper correspondiente sea ajustado.

Los artículos generados por IA pueden contener imprecisiones en la interpretación de los datos. CODA presenta los datos tal como los publica la fuente oficial y no los modifica ni ajusta.