¿Podemos utilizar la IA para descifrar los khipu?
Traducción usando el Traductor de Google (Read the original text in English)
Esta es la pregunta que nos hacen con más frecuencia. Sobre el papel, parecería que usar inteligencia artificial (IA) para descifrar los khipus, los intrincados dispositivos de registro de información mediante cuerdas anudadas del Imperio Inca, sería la solución perfecta. Después de todo, la IA ha acaparado titulares por descifrar lenguas antiguas y reconocer patrones en conjuntos de datos masivos. Entonces, ¿por qué la IA no ha revelado los secretos de estos enigmáticos artefactos textiles que han desconcertado a los investigadores durante más de un siglo?
La brecha entre las expectativas y la realidad de la IA
En los últimos años se han logrado avances notables en los enfoques computacionales aplicados a los sistemas de escritura antiguos. Los algoritmos de aprendizaje automático han ayudado a identificar patrones en escrituras indescifradas, a reconstruir textos dañados[1] y a comprender diversas lenguas antiguas[2]. En los últimos cinco años, varios proyectos han reconstruido con éxito escrituras perdidas a partir de datos limitados, pero solo cuando la lengua tiene un descendiente o pariente conocido (como la relación del ugarítico con el hebreo, o la conexión del Lineal B con el griego) y cuando hay suficiente texto para la inferencia estadística, lo que normalmente requiere miles de palabras en lugar de docenas.
Estos éxitos han generado la expectativa de que la IA podría ser una clave universal para descifrar cualquier sistema de comunicación antiguo. Sin embargo, esta suposición pasa por alto requisitos fundamentales que comparten las aplicaciones exitosas de IA: una cantidad sustancial de datos para el aprendizaje e, idealmente, una «Piedra Rosetta», un texto bilingüe o un punto de referencia conocido que sirva de base para el análisis. ## Los Cinco Pilares del Desciframiento
Se ha observado que, a pesar de las diferencias culturales, las diferencias en los sistemas de escritura, etc., el desciframiento de escrituras desconocidas sigue una estrategia común. Desde los jeroglíficos egipcios hasta la escritura maya, todos los desciframientos exitosos han tenido en común los siguientes cinco elementos. Conocidos ahora como Los Cinco Pilares del Desciframiento, fueron descritos por primera vez por su autor original, Michael Coe, en su fascinante libro sobre el desciframiento del código maya[3]. Reafirmados por el gramatólogo (el estudio científico de los sistemas de escritura), Marc Zender, en su artículo Teoría y Método en el Desciframiento Maya[4], los cinco pilares son:
Los cinco pilares de Coe son:
- Tipología de la escritura: comprender el tipo de signos y tener un inventario de signos.
- Corpus: una base de datos de documentos.
- Idioma: conocimiento del idioma que se está codificando.
- Contexto cultural: comprensión de los gobernantes, lugares y eventos históricos.
- Bilingüismo: un texto bilingüe o Piedra Rosetta.
Este marco proporciona una estructura valiosa para comprender exactamente en qué punto se encuentra el desciframiento de los khipus y por qué la IA aún no ha podido "descifrar el código".
Pilar 1: Tipología de la escritura e inventario de signos
Después de más de un siglo de investigación, los estudiosos han desarrollado una sólida comprensión de los elementos básicos de un khipu. Normalmente, cada khipu consta de un cordón principal con cordones colgantes, que potencialmente codifican información en múltiples variables: tipos de nudos, número y posición de los nudos, colores de los cordones, dirección del giro final del cordón, materiales, espaciado, longitud y patrones de agrupación.
El aspecto numérico de los khipus incas es quizás el mejor comprendido, con el sistema de posición decimal a menudo codificado en sus nudos, que fue descifrado en 1912 por L. Leland Locke[5]. Desde entonces, también se han identificado claramente múltiples operaciones aritméticas, como las sumas.
En consecuencia, este pilar es bastante sólido para los quipus.
Pilar 2: Corpus
Estudios recientes sitúan el número total de khipus conservados en la actualidad entre 1300 y 1600[6][7]. Si bien esta cifra puede parecer elevada, en realidad es relativamente pequeña para fines de aprendizaje automático. Cuando los sistemas de IA aprenden a traducir entre idiomas, generalmente se entrenan con millones de pares de oraciones. El corpus de khipus es mucho menor de lo que se consideraría adecuado para la mayoría de las aplicaciones de aprendizaje automático.
Además, nuestra base de datos de khipus existente está plagada de datos incorrectos o incompletos. Los registros digitales a menudo contienen errores y omisiones; a veces, los signos solo se registran parcialmente y con frecuencia hay errores de digitalización. En algunos casos, los khipus se han introducido en la base de datos al revés. Lo que complica aún más las cosas es el hecho de que muchos khipus están incompletos o dañados.
Por lo tanto, una de las principales dificultades a las que nos enfrentamos debido a estos datos desordenados e incompletos es que resulta difícil probar estadísticamente las hipótesis de desciframiento.
Este pilar representa una debilidad significativa para los khipus.
Pilar 3: Lenguaje
El quechua, la lengua principal del Imperio Inca, todavía lo hablan millones de personas en la actualidad. Los lingüistas tienen un amplio conocimiento tanto del quechua moderno como de las formas históricas documentadas en textos de la época colonial.
Sin embargo, esta fortaleza se ve atenuada por una incertidumbre fundamental: no estamos completamente seguros de qué tipo de información codifican los khipus ni de si funcionan como un sistema de escritura convencional, es decir, codificando directamente el sonido y el lenguaje. Las fuentes coloniales mencionan que los khipus se utilizaban para registrar historias, genealogías, poesía y leyes, pero algunos investigadores argumentan que los khipus podrían haber sido simplemente dispositivos mnemotécnicos en lugar de codificar narrativas directamente. Los khipus pueden codificar información numérica o basada en patrones en lugar de lenguaje fonético, un escenario en el que las herramientas típicas de análisis lingüístico de la IA simplemente no se aplican.
Por lo tanto, si bien este pilar se encuentra en relativamente buen estado, es difícil saber si podemos siquiera aprovecharlo en el caso de los khipus.
Pilar 4: Contexto cultural
Los investigadores tienen un conocimiento sustancial sobre la historia, la organización social y los sistemas administrativos incas. Este contexto es invaluable para formular hipótesis sobre lo que podrían contener khipus específicos. En el Valle de Santa, por ejemplo, los investigadores han trabajado para cotejar seis khipus arqueológicos con datos del censo colonial de la misma región[8].
Sin embargo, incluso con este conocimiento contextual, los investigadores carecen de una confirmación definitiva. El contexto cultural puede sugerir lo que un khipu podría significar, pero aún no puede demostrar lo que realmente dice. Además, los sistemas de IA no poseen el conocimiento cultural ni la comprensión contextual que tienen los humanos. Pueden identificar patrones estadísticos, pero no pueden intuir el significado cultural sin un entrenamiento explícito con ejemplos.
Por lo tanto, al igual que en el caso anterior, si bien este pilar parece estar en relativamente buenas condiciones, aún no se ha demostrado que sea la clave para el desciframiento de los khipus.
Pilar 5: Texto bilingüe: La Piedra Rosetta perdida
El quinto pilar representa la brecha más crítica y la razón principal por la que la IA no puede simplemente "descifrar el código". No existe un texto bilingüe confirmado que indique definitivamente a los investigadores lo que dice un khipu específico. La aproximación más cercana proviene de alrededor de un centenar de documentos judiciales coloniales españoles en los que se utilizaron khipus como prueba y luego se tradujeron al español o al quechua para el registro judicial. Sin embargo, los khipus originales a los que se hace referencia en estos documentos no se han identificado ni cotejado con los ejemplos que se conservan. Sin los khipus físicos que corresponden a estas traducciones, los investigadores no pueden establecer las correspondencias confirmadas necesarias para el desciframiento.
Sin ejemplos confirmados de lo que dicen realmente los khipus específicos, no hay forma de entrenar un algoritmo de aprendizaje supervisado, el tipo de IA más exitoso en tareas de desciframiento. Por eso, los sistemas de IA, como Google Translate, no se pueden aplicar simplemente a los khipus.
Este es nuestro pilar faltante.
Comprender la IA: Aprendizaje supervisado frente a aprendizaje no supervisado
Cuando la mayoría de la gente pregunta si la IA puede descifrar los khipus, piensa en sistemas como Google Translate: grandes modelos lingüísticos entrenados con grandes cantidades de texto generado por humanos. Estos se basan en el aprendizaje supervisado, donde la IA se entrena con ejemplos emparejados: entrada y salida, texto en un idioma y su traducción en otro.
Con suficientes datos, los sistemas de IA modernos (es decir, las redes neuronales profundas) pueden encontrar patrones, detectar símbolos recurrentes, límites de palabras y patrones sintácticos, y calcular estadísticas de coocurrencia. Pueden inferir relaciones agrupando palabras o símbolos que se comportan de manera similar (como verbos o sustantivos), compararlos con idiomas conocidos para detectar posibles similitudes y, en raras ocasiones, construir mapas de traducción que alineen una escritura desconocida con una conocida cuando existen corpus bilingües.
El problema fundamental con los khipus y la IA es sencillo: si bien los investigadores tienen la entrada (los propios khipus físicos), carecen de la salida: lo que realmente dicen estos khipus. Sin traducciones confirmadas, no hay forma de entrenar un sistema de aprendizaje supervisado.
La alternativa es el aprendizaje no supervisado, donde la IA identifica patrones sin que se le diga lo que significan. Algunas arquitecturas de redes neuronales pueden identificar qué elementos coocurren con frecuencia y, por lo tanto, están conceptualmente relacionados. Sin embargo, identificar que existe un patrón es muy diferente de comprender lo que significa ese patrón. Sin ejemplos confirmados de lo que realmente dice un khipu, estos patrones permanecen sin explicación.
Los enfoques actuales de IA fallan por varias razones:
- Cuando el corpus lingüístico es demasiado pequeño, por ejemplo, idiomas con pocos datos como el elamita, el lineal A o el Manuscrito Voynich.
- Cuando no hay texto bilingüe.
- Cuando la escritura puede codificar información no lingüística.
La investigación sobre los khipus se enfrenta a todos estos desafíos simultáneamente. En tales casos, la IA puede producir conjeturas, agrupaciones de símbolos o patrones, pero hasta ahora no son verificables. Es detección de patrones, no desciframiento.
Lo que han revelado los enfoques computacionales
A pesar de la ausencia de una Piedra Rosetta, los investigadores han aplicado diversas técnicas computacionales a los datos de los khipus. El investigador Jon Clindaniel, por ejemplo, aplicó arquitecturas de transformadores de redes neuronales, utilizando BERT, para identificar relaciones semánticas, revelando conjuntos de colores estrechamente relacionados[9]. Anteriormente he utilizado enfoques estadísticos, incluido el modelado de temas, obteniendo resultados aproximadamente similares.[10]
La pregunta crucial es: ¿qué significan estos patrones? Sin ejemplos confirmados del contenido de los khipus, los investigadores no pueden responder de forma definitiva. Los patrones existen, la IA los detecta de forma fiable, pero su significado sigue siendo opaco.
Estos enfoques computacionales funcionan mejor como métodos híbridos que combinan el reconocimiento de patrones de la IA con la experiencia humana. El desciframiento asistido por IA funciona mejor cuando las herramientas se combinan con investigadores que pueden evaluar la plausibilidad y el contexto: pistas materiales y arqueológicas, y modelos interdisciplinarios que vinculan símbolos con cantidades, direcciones o acciones. Los investigadores están explorando cómo los datos de los khipus podrían relacionarse con recuentos o narrativas, integrando la detección computacional de patrones con el conocimiento cultural e histórico.
La lección más amplia sobre la IA
El caso de los khipus ofrece una importante lección sobre las capacidades y limitaciones de la IA. La IA es una herramienta poderosa, pero no puede crear información que no existe en los datos ni superar las lagunas fundamentales del conocimiento solo con la potencia computacional. Las aplicaciones más exitosas de la IA a los sistemas de escritura antiguos han involucrado a investigadores que ya comprendían bien el sistema y necesitaban ayuda con tareas específicas: completar texto dañado, identificar la caligrafía de los escribas o procesar grandes colecciones de documentos rápidamente.
Cuando la gente imagina a la IA descifrando khipus, visualiza introducir datos en una red neuronal y recibir traducciones, pero los sistemas de IA aprenden de ejemplos. Sin ejemplos confirmados, sin ese quinto pilar que falta, el aprendizaje supervisado no tiene nada de lo que aprender. El aprendizaje no supervisado puede identificar patrones, pero no puede explicar su significado. Es como pedirle a un sistema de IA que descifre un documento cuando no se le puede decir si está escrito en un alfabeto fonético, un sistema logográfico, notación musical o una fórmula matemática.
La respuesta
Entonces, ¿por qué aún no podemos usar la IA para descifrar los khipus? Examinar los cinco pilares de Coe lo deja claro:
- Pilar 1 (Tipología de la escritura): Bastante sólido
- Pilar 2 (Corpus): Pequeño, incompleto y propenso a errores
- Pilar 3 (Lenguaje): Sólida base lingüística, pero incertidumbre sobre si los khipus codifican el lenguaje y cómo lo hacen
- Pilar 4 (Contexto cultural): Conocimiento sustancial, pero aún existen lagunas
- Pilar 5 (Escritura bilingüe): Inexistente, no hay una Piedra Rosetta confirmada
Sin el crucial quinto pilar, la IA no puede funcionar como se imagina. El aprendizaje supervisado requiere ejemplos verificados que aún no existen. El aprendizaje no supervisado puede identificar patrones, pero no interpretarlos.
Esto no significa que los enfoques computacionales sean inútiles. A medida que nuestro conjunto de datos crezca y nuestro desciframiento sea más completo, la IA podrá servir como un valioso laboratorio para experimentos y comprensión. Actualmente, los métodos híbridos que combinan la inferencia estadística con enfoques interdisciplinarios, como el equipo de la Guía de Campo de Khipu, ofrecen las direcciones más prometedoras.
En última instancia, el desciframiento no es puramente un problema técnico. Es una empresa profundamente humana que requiere creatividad, perspicacia cultural, conocimiento histórico e intuición, cualidades que los sistemas de IA actuales aún no poseen. Los eruditos que descifraron escrituras como los jeroglíficos egipcios y los glifos mayas lo lograron mediante una combinación de conocimiento lingüístico, contexto histórico, comprensión cultural e intuición, tanto arte como ciencia.
La historia de los khipus y la IA no es una historia de fracaso tecnológico. Es un recordatorio de que algunos misterios requieren más que algoritmos para resolverse. Requieren salvar no solo las brechas lingüísticas, sino también las culturales y temporales: comprender no solo qué son los símbolos, sino qué significaban para las personas que los crearon para registrar, recordar y comunicar a través del tiempo. Ese es un desafío que sin duda nos mantendrá, como investigadores, ocupados durante los próximos años.
Assael, Yannis, Thea Sommerschield, Brendan Shillingford, et al. 2022. “Restoring and Attributing Ancient Texts Using Deep Neural Networks.” Nature 603 (7900): 280–83. https://doi.org/10.1038/s41586-022-04448-z. ↩︎
Sommerschield, Thea, Yannis Assael, John Pavlopoulos, et al. 2023. “Machine Learning for Ancient Languages: A Survey.” Computational Linguistics 49 (3): 703–47. https://doi.org/10.1162/coli_a_00481. ↩︎
Coe, Michael D., "Breaking the Maya Code", Thames & Hudson, 1 de enero de 2012. ↩︎
Zender, Marc. "Theory and Method in Maya Decipherment." The PARI Journal Volumen XVIII, No. 2, Otoño de 2017. ↩︎
Locke, L. Leland. “El antiguo quipu, un registro peruano de nudos”. American Anthropologist 14, n.º 2 (1912): 325–32. http://www.jstor.org/stable/659935. ↩︎
Medrano, Manuel. 2021. Quipus: Mil Años de Historia Anudada En Los Andes y Su Futuro Digital. Planeta. ↩︎
Thompson, Karen M. 2025. “Connecting Objects and Literature: A Case Study with Khipus, the ‘Khipu-Biblio Cross-Reference.’” Advances in Archaeological Practice, 26 de agosto, 1–18. https://doi.org/10.1017/aap.2025.3. ↩︎
FitzPatrick, Mackinley. 2024. “Nuevos hallazgos sobre la disposición de los cordones y la jerarquía social en seis khipus del Valle de Santa, Perú”. Ethnohistory 71 (4): 443–69. https://doi.org/10.1215/00141801-11266328. ↩︎
Clindaniel, Jon. 2024. “Colorful Insights from an AI Khipukamayuq.” Preimpresión, SocArXiv, 22 de mayo. https://doi.org/10.31235/osf.io/4p7s5. ↩︎
Khosla, Ashok. 2022. “Cord Color 'Topic Modeling'".
www.khipufieldguide.com, https://www.khipufieldguide.com/notebook/analyses/ascher_color_count.html#cord-color-topic-modeling. ↩︎