domingo, 14 de marzo de 2021

No te hagas que la Virgen te habla

 


Para Laura García, Pablo Boullosa,  Eduardo Casar y Germán Ortega

 

Hace tiempo que las inteligencias artificiales (IA) pasaron la “prueba de Turing”, que por cierto es ya muy obsoleta. Esta prueba quiere decir que una IA puede emular de forma convincente un diálogo “humano”: o sea como platicar con Siri, pero más sofisticado. La manera de hacerlo se basa en dos cosas: la primera es reconocimiento de voz para saber qué se está preguntando. La segunda es una enorme librería de diccionarios, frases, expresiones idiomáticas y muestras de diálogos, para “entender” la pregunta y buscar una respuesta óptima.

El concepto es sencillo pero la verdad es que el lenguaje natural es endiabladamente difícil de traducir a algoritmos porque es vago, inconsistente y constantemente estamos jugando con él e inventando burradas.

Las frases idiomáticas y el humor son particularmente difíciles porque usan ironía y sarcasmo, cosas que están muy relacionadas con la entonación. Por ejemplo: la IA puede tener en su memoria millones de frases hechas, muchas más que las que puede recordar una persona, pero se le dificulta mucho captar cambios de entonación en un contexto donde lo que se quiere decir es lo contrario de lo que expresan las palabras (ironía).

Esto crea un problema: le podemos decir a la IA que un conjunto de palabras no significan lo que nominalmente dicen y explicarle una gran cantidad de frases: por ejemplo que “montar un cirio” ó “armar la de San Quintín” significan “hacer un alboroto.” Pero no importa cuántas frases se sepa, es muy difícil que pueda interpretar correctamente cuando se topa con una cosa nueva (“arder Troya”) que depende de, por ejemplo, contexto cultural. Veamos tres ejemplos.

 

Hay más tiempo que vida

Esta frase no tiene sentido, o por lo menos no con el significado que le damos: la intención es decir “no te preocupes, ya habrá oportunidad”, pero el afirmar que hay más tiempo que vida de hecho dice lo contrario: estamos diciendo “te vas a morir y el tiempo seguirá.” Eso no es ningún consuelo y no dice lo que de hecho queremos expresar. Es una frase mal construida, pero la hemos aceptado tal cual. Ahora bien, esta frase es fácil de aprender por una IA, porque es simplemente un conjunto de palabras que significa “no te preocupes”, y al verla por primera vez, puede ver el contexto antes y después y “entender” a lo que equivale.


Ahorita

Esto es más difícil, porque para empezar es una palabra técnicamente mal construida: el diminutivo de “ahora.” En inglés se puede decir in a minute pero no se dice little now, que saltaría como algo sin sentido. Pero la real dificultad es que el intervalo de tiempo expresado por “ahorita” es totalmente dependiente del contexto y del tono con el que se dice, y puede darle el sentido de “en este mismo instante”, hasta “en un rato más”, o incluso “nunca”. Se necesita mucho más entrenamiento y ejemplos para poder detectar el sentido de esta palabra.

 

No te hagas que la Virgen te habla

Esta expresión es de México y es un ejemplo de humor, contexto situacional y contexto cultural. La frase es una forma de decir “no finjas que no entiendes” y se la decimos a alguien que está tratando de salirse por la tangente de una situación incómoda, o evitar una pregunta que no quiere responder.

El problema al escuchar esta frase por primera vez, es reconocer el contexto cultural y la sutil construcción que omite palabras. Primero que nada: dice la leyenda que en 1531, la Virgen María se le apareció al indígena Juan Diego y le dio varios mensajes; así que es de esa virgen de quien estamos hablando. Ahora bien, podemos imaginarnos la expresión que pondríamos si nos pasara lo mismo; o sea una expresión de asombro y lo más importante: de ignorar todo lo que está a nuestro alrededor.

Sabiendo esto, la expresión más detallada, sería:

“No hagas como que la Virgen María te está hablando, como a Juan Diego”

Esto es una maravillosa combinación de humor y contexto cultural, que no es nada fácil entender a la primera, incluso para un hispanohablante, e incluso para un mexicano.

 

Traducción

Si bien aún nos falta un buen rato para contar chistes con Siri, el campo de la traducción de textos sí ha avanzado muchísimo. Fuera de la poesía y el humor, los traductores automáticos son bastante útiles para textos técnicos, cartas y en general, cosas que no lleven ambiguedad ni juego.

Las expresiones idiomáticas están a mitad de camino: como decíamos, son frases que se deben tomar completas, no literales, y no es difícil hacer compendios. Una estrategia que Google Translate (GT) ha adoptado es pedir la ayuda de sus usuarios: si ven que una traducción está mal hecha, podemos enviar mejores opciones e ir mejorando su base de datos. Aquí se ha visto avance:

Por ejemplo, en 2014 escribí que el título de la película House of Flying Daggers estaba mal manejado por  GT, porque al poner el título en chino 十面埋伏 (shi mian mai fu), ponía precisamente “Casa de las dagas voladoras”; que es como querer traducir “Airplane!” y obtener como respuesta “¿Dónde está el piloto?”

La frase es poética, quiere decir literalmente “ataque desde diez flancos” y hoy está por fin correctamente traducida como “emboscada”, seguramente gracias a un usuario diligente.

 


Como podemos ver en la imagen principal de este artículo, GoogleTranslate aún no sabe traducir “ahorita” y hay muchas cosas más que aún siguen pendientes, así que si usted sabe bien inglés y español, en un rato que no tenga nada mejor que hacer, ayúdele a Google a traducir mejor las expresiones idiomáticas del español:

 


  

1 comentario:

  1. ¡Muy buen texto, querido Alfonso, y un honor que nos hayas mencionado! Me pregunto si la ironía, para ser efectiva, no debe correr el riesgo de no ser incomprendida, no sólo por GT y personas que hablan el idioma, sino incluso por personas con las que se comparten las principales referencias culturales. En otras palabras, quizá la ironía es más eficaz mientras más fresca y más arriesgada, y menos eficaz en la medida en que se incorpora como expresión idiomática cuyo sentido puede establecerse sin lugar a dudas. En fin, es sólo un comentario a botepronto. ¡Gracias de nuevo!

    ResponderEliminar