Metodología

Última actualización: mayo de 2026

Visión general

Facthem monitoriza los debates del Congreso de los Diputados y verifica automáticamente las afirmaciones factuales realizadas por los parlamentarios. Todo el proceso (desde la transcripción bruta hasta el veredicto publicado) funciona sin intervención editorial humana. Esta página explica cada paso.

Paso 1: Obtención de sesiones y segmentación de intervenciones

Cada sesión del Congreso de los Diputados se obtiene directamente del portal oficial del Congreso. La transcripción de cada sesión se descarga y se divide en intervenciones individuales, una por turno de palabra. Cada intervención se asocia a su diputado junto con metadatos disponibles como grupo parlamentario, partido y fecha de la sesión. Esta representación estructurada es la que alimenta el resto del pipeline.

Paso 2: Extracción, normalización y enriquecimiento de afirmaciones

Cada intervención es procesada por un modelo de lenguaje con la tarea de identificar afirmaciones factuales discretas y falsables. Las opiniones, predicciones, preguntas retóricas y declaraciones normativas («deberíamos…», «sería mejor si…») quedan excluidas; solo se extraen afirmaciones que aseveran un hecho concreto y verificable sobre el mundo.

Para cada afirmación extraída, el modelo realiza tres operaciones:

Normaliza la afirmación en una frase canónica e independiente del contexto que puede evaluarse sin necesidad de consultar el discurso original.
Categoriza la afirmación por tema (economía, defensa, sanidad, etc.) y alcance geográfico.
Enriquece la afirmación con metadatos estructurados (etiquetas temáticas, entidades mencionadas y cualquier afirmación numérica o temporal implícita) que mejoran la calidad del paso de verificación.

Paso 3: Verificación automatizada mediante LLM + búsqueda web

Cada afirmación normalizada se pasa a un modelo de lenguaje con acceso a búsqueda web en tiempo real. El modelo busca evidencia de forma autónoma, razona sobre lo que encuentra y produce un veredicto. No es una coincidencia de palabras clave: el modelo lee fuentes, evalúa su relevancia y fiabilidad, y construye un argumento a favor o en contra de la afirmación antes de llegar a una conclusión.

Una afirmación solo puede recibir un veredicto definitivo si la evidencia cumple uno de los siguientes umbrales:

1 fuente primaria oficial (institución pública, organismo estadístico oficial u organización intergubernamental que confirme o refute directamente la afirmación: INE, Banco de España, Eurostat, OCDE, Banco Mundial, etc.), o bien
2 fuentes secundarias independientes (medios de comunicación, publicaciones académicas u organismos de referencia reputados que corroboren el mismo hallazgo sin depender entre sí).

Si no se cumple ninguno de los dos umbrales, la afirmación se marca como No verificable independientemente de lo que el modelo considere probable. El resultado de este paso incluye el veredicto, una puntuación de confianza, las fuentes citadas, las omisiones identificadas en la afirmación original y cualquier error factual detectado. Todo esto se publica en la página de cada afirmación.

Definiciones de los veredictos

Cada afirmación recibe exactamente uno de los siguientes veredictos:

Veredicto	Significado
✅ Confirmado	La afirmación es exacta y está respaldada por al menos una fuente primaria oficial o dos fuentes secundarias independientes.
⚠️ Con matices	La afirmación es ampliamente correcta, pero omite contexto, calificaciones o matices importantes que afectan materialmente a su interpretación.
🟠 Sobreestimado	La afirmación asevera un valor o magnitud verificablemente superior a lo que avalan las evidencias.
🟠 Subestimado	La afirmación asevera un valor o magnitud verificablemente inferior a lo que avalan las evidencias.
❌ Falso	La afirmación está directamente contradicha por evidencias de fuentes primarias.
❓ No verificable	No existe evidencia pública suficiente para confirmar o refutar la afirmación en el momento de su procesamiento.

Puntuación de confianza

Cada veredicto va acompañado de una puntuación de confianza de 0 a 100. Esta puntuación refleja la certeza interna del modelo sobre el veredicto dado la evidencia disponible; no es una probabilidad objetiva. Una puntuación alta indica que la evidencia fue clara y coherente; una baja indica que la evidencia fue ambigua, escasa o contradictoria.

Como referencia: puntuaciones superiores a 80 indican un respaldo probatorio sólido; entre 50 y 80, un respaldo moderado; por debajo de 50, el veredicto debe tratarse como tentativo. Los veredictos No verificable suelen tener puntuaciones bajas por definición.

Jerarquía de fuentes

Las fuentes se ponderan en el siguiente orden. Cuando una afirmación puede resolverse con una fuente primaria, esa fuente es determinante y las fuentes secundarias se listan únicamente como complemento.

Fuentes primarias: datos y documentos publicados directamente por instituciones públicas: el INE, el Banco de España, el Eurostat, la EUR-Lex y los informes de la OCDE, FMI, Banco Mundial y otros organismos intergubernamentales.

Fuentes académicas: publicaciones revisadas por pares en revistas indexadas. Con mayor peso que la prensa generalista, pero por debajo de los datos institucionales primarios.

Fuentes secundarias: prensa especializada de referencia, organismos analíticos independientes y medios de comunicación reputados. Se utilizan cuando las fuentes primarias son insuficientes o no están disponibles. Tienen menos peso en el veredicto final.

Una sola fuente primaria oficial es suficiente para un veredicto definitivo. Se requieren dos fuentes secundarias independientes cuando no hay fuente primaria disponible. Si no se cumple ninguno de los dos umbrales, la afirmación se marca como No verificable.

Limitaciones

Este pipeline es experimental. Los modelos de lenguaje pueden alucinar fuentes, malinterpretar afirmaciones numéricas, no recuperar datos recientes o juzgar mal la relevancia de la evidencia. Cada veredicto publicado en este sitio debe tratarse como un punto de partida para la investigación, no como una conclusión definitiva.

Ningún veredicto ha sido revisado, corroborado ni validado por un periodista, experto jurídico u otro profesional humano antes de su publicación. Consulta el aviso legal para el descargo de responsabilidad completo.

Datos estructurados

Cada página de afirmación incluye datos estructurados schema.org ClaimReview, siguiendo las directrices de Google para datos estructurados de fact-check. Esto permite a los motores de búsqueda mostrar el veredicto directamente en los resultados.

Contacto

Para reportar un error en un veredicto o sugerir una mejora en la metodología, escribe a .