Los miedos ante las posibles consecuencias desastrosas que puede acarrear el desarrollo de la inteligencia artificial están más que presentes en el día a día. Cada semana vemos reflejados esos temores en los medios de comunicación, con expertos dando la voz de alarma. No les falta razón: la IA, como casi todo, plantea peligros en el camino si se usa con malos fines y sin ningún tipo de ética.
Sin embargo, lo bueno de la tecnología es que esconde tantas maravillas como problemas puede dar. Un buen ejemplo de ello nos lo acaba de mostrar DeepMind, el laboratorio de investigación de IA de Google.
Gracias a su último avance la inteligencia artificial ya no solo mira al futuro, sino que también nos ayuda a comprender un poco más de dónde venimos. Y si hay una civilización que ha marcado la historia de la humanidad, especialmente en España y Europa, esa es la del Imperio Romano.
Aeneas: una IA entrenada para leer el latín y completar textos milenarios
El último gran proyecto de DeepMind se llama Aeneas y acaba de publicarse en la revista Nature. Se trata de un modelo de inteligencia artificial diseñado para leer, restaurar y contextualizar textos en latín que han sobrevivido a lo largo de los siglos en piedras, monumentos o fragmentos arqueológicos, muchos de ellos erosionados o incompletos. Lo que antes requería años de trabajo y debate académico, ahora puede resolverse en segundos con ayuda de esta herramienta.
Aeneas, nombre en latín del mítico héroe de la guerra de Troya Eneas, ha sido entrenada con cerca de 200.000 inscripciones romanas y caracteres latinos para aprender patrones de escritura, fórmulas utilizadas en distintas regiones del Imperio y estructuras lingüísticas propias de la época. Así, puede predecir palabras que faltan en un texto fragmentado, ubicar su origen geográfico y estimar con bastante precisión cuándo se escribió.
“Seleccionamos un conjunto de datos amplio y fiable, fruto de décadas de trabajo de historiadores para crear colecciones digitales, en particular las bases de datos epigráficas de Roma (EDR), Heidelberg (EDH) y Clauss-Slaby (EDCS-ELT). Limpiamos, armonizamos y vinculamos estos registros en un único conjunto de datos procesable por máquina al que llamamos Conjunto de Datos Epigráficos Latinos (LED), que comprende más de 176.000 inscripciones latinas de todo el mundo romano antiguo”, explican desde Google DeepMind.
Rellena huecos, predice fechas y sitúa los textos en el mapa
Aeneas funciona como una especie de detective digital. Cuando se le da un texto antiguo (aunque esté incompleto), analiza lo que tiene delante usando un modelo de IA basado en tecnología conocida como ‘transformers’, similar a la que usan los chatbots actuales.
Primero, lee el texto en latín, intenta reconstruir las partes que faltan y, al mismo tiempo, calcula cuándo se escribió. Para saber de qué lugar procede, también se fija en la imagen de la inscripción, ya que el estilo visual o la forma de tallar las letras pueden dar pistas.
Después, compara esa inscripción con LED, la enorme base de datos creada por Google DeepMind que reúne cientos de miles de textos similares. Lo hace gracias a un sistema que crea una especie de ‘huella histórica’ para cada texto. Esa huella contiene información sobre lo que dice, en qué idioma está, qué antigüedad tiene, de dónde podría venir y si se parece a otras inscripciones conocidas.
Según sus desarrolladores, Aeneas restaura inscripciones dañadas con una precisión del 73% en espacios de hasta diez caracteres. Si bien reconocen que esta precisión “disminuye al 58% cuando se desconoce la longitud de la restauración”, subrayan que esto “constituye una tarea increíblemente compleja”.
Una ventaja de esta herramienta es que muestra su razonamiento “de forma interpretable”, es decir, proporciona mapas de relevancia que resaltan qué partes de la información influyeron en sus predicciones.
Google asegura que, gracias al uso de datos visuales, su modelo puede atribuir una inscripción a una de las 62 provincias romanas antiguas con una precisión del 72%. Para la datación, Aeneas sitúa un texto dentro de los trece años de los rangos de fechas proporcionados por los historiadores.
Uso de la IA en un caso real
Para demostrar cómo funciona Aeneas en un caso real, el equipo de DeepMind puso a prueba la IA con uno de los textos más importantes del mundo romano: la Res Gestae Divi Augusti. Esta inscripción, grabada en piedra en varios puntos del Imperio, recoge la autobiografía del emperador Augusto, detallando sus logros y el impacto de su gobierno.
Aeneas fue capaz de fechar el texto con gran precisión, alineándose con las teorías históricas más aceptadas. Detectó dos posibles momentos de redacción: uno en torno al 10 a. C. y otro entre el 10 y el 20 d. C., justo cuando los expertos creen que fue escrito.
Lo sorprendente es que la IA no se dejó confundir por las muchas fechas mencionadas en el texto, ya que usó pistas más sutiles como el estilo del latín, nombres propios, referencias institucionales o monumentos históricos para hacer sus cálculos.
Una herramienta para historiadores, no un sustituto
Se estima que cada año se descubren unas 1.500 nuevas inscripciones en latín, que abarcan desde los decretos de emperadores hasta los epitafios de individuos esclavizados, y que preservan información valiosa sobre la vida cultural y lingüística de un imperio que se extendió por cinco millones de kilómetros cuadrados y más de 2.000 años. Comprender su significado es clave para entender la historia.
Lejos de reemplazar a los expertos, Aeneas se presenta como un asistente para epigrafistas, historiadores y arqueólogos. En pruebas realizadas con profesionales, se observó que su uso aumentaba la confianza de los investigadores y mejoraba los resultados en tareas de datación, restauración y análisis.
Además, DeepMind ha liberado la herramienta de forma abierta en el portal predictingthepast.com, donde cualquiera puede probar cómo trabaja esta IA con inscripciones reales.
Aunque solemos asociar la inteligencia artificial con avances futuristas, Aeneas demuestra que esta tecnología también puede ayudar a reconstruir nuestra memoria colectiva, pieza a pieza, piedra a piedra. Porque si bien el latín es una lengua muerta, sus mensajes aún tienen mucho que contar. Y ahora, gracias a una IA, es posible escucharlos de nuevo.