Google se está volviendo más multilingüe, pero ¿obtendrá los matices?
LIMA, Perú (AP) — Alrededor de 10 millones de personas hablan quechua, pero tratar de traducir automáticamente correos electrónicos y mensajes de texto a la familia de lenguas indígenas más hablada en las Américas ha sido casi imposible durante mucho tiempo.
Eso cambió el miércoles, cuando Google agregó el quechua y una variedad de otros idiomas a su servicio de traducción digital.
El gigante de Internet dice que la nueva tecnología de inteligencia artificial le permite expandir drásticamente el repertorio de idiomas del mundo de Google Translate. Esta semana sumó 24, entre ellos el quechua y otras lenguas indígenas sudamericanas como el guaraní y el aimara. También agrega una serie de idiomas africanos y del sur de Asia ampliamente hablados que han estado ausentes durante mucho tiempo en los productos tecnológicos populares.
“Observamos idiomas con poblaciones desatendidas muy grandes”, dijo a los periodistas el investigador de Google, Isaac Caswell.
Las noticias de la exhibición anual de tecnología de E/S de la compañía de California se pueden celebrar en muchos rincones del mundo. Pero también generará críticas de aquellos frustrados con productos tecnológicos anteriores que no han entendido los matices de su idioma o cultura.
El quechua era la lengua franca del Imperio Inca, que se extendía desde lo que ahora es el sur de Colombia hasta el centro de Chile. Su estado comenzó a declinar. tras la conquista española del Perú hace más de 400 años.
Agregarlo a los idiomas reconocidos de Google es una gran victoria para los activistas del idioma quechua como Luis Illaccanqui, un peruano que creó el sitio web Qichwa 2.0, que incluye diccionarios y recursos para aprender el idioma.
«Ayudará a poner al quechua y al español en igualdad de condiciones», dijo Illaccanqui, que no participó en el proyecto de Google.
Illaccanqui, cuyo apellido en quechua significa «tú eres un rayo», dijo que el traductor también ayudará a mantener vivo el idioma con una nueva generación de jóvenes y adolescentes, «que hablan quechua y español al mismo tiempo y están fascinados con las redes sociales». »
Caswell calificó la noticia como un «tremendo salto tecnológico» porque hasta hace poco no era posible agregar idiomas si los investigadores no podían encontrar una cantidad suficiente de texto en línea, como libros, publicaciones digitales, periódicos o redes sociales, para su IA. sistemas para aprender.
Los gigantes tecnológicos de Estados Unidos no tienen un gran historial hacer que su tecnología lingüística funcione bien fuera de los mercados más prósperos, un problema que también los hace más difíciles de detectar información errónea peligrosa en sus plataformas. Hasta esta semana, Google Translate se ofrecía en idiomas europeos como el frisón, el maltés, el islandés y el corso -cada uno con menos de un millón de hablantes-, pero no en idiomas del este de África, como el oromo y el tigrinya, que tienen millones de hablantes.
Los nuevos idiomas se implementarán en el sistema Android de Google esta semana y en los dispositivos de Apple a finales de este mes. Todavía no serán entendidos por el asistente de voz de Google, que actualmente los limita a traducciones de texto a texto. Google dijo que estaba trabajando para agregar reconocimiento de voz y otras características, como la capacidad de traducir un letrero al apuntar una cámara hacia él.
Esto será importante para los idiomas ampliamente hablados como el quechua, especialmente en la atención médica, ya que muchos médicos y enfermeras peruanos que solo hablan español trabajan en áreas rurales y “no pueden entender a los pacientes que hablan principalmente quechua”, dijo Illaccanqui.
«La próxima frontera, o desafío, es trabajar en el habla», dijo Arturo Oncevay, investigador peruano de traducción automática de la Universidad de Edimburgo, quien cofundó un grupo de investigación para mejorar la tecnología de los idiomas indígenas en las Américas. “Las lenguas indígenas de las Américas son tradicionalmente orales”.
En su anuncio, Google advirtió que la calidad de las traducciones en los idiomas recién agregados «todavía está muy por detrás» de otros idiomas que admite, como inglés, español y alemán, y señaló que los modelos «cometerán errores y mostrarán sus propios prejuicios». Pero la compañía solo agregó idiomas si sus sistemas de inteligencia artificial alcanzaron un cierto umbral de competencia, dijo Caswell.
«Si hay un número significativo de casos en los que está muy mal, entonces no lo incluiremos», dijo. «Incluso si el 90% de las traducciones son perfectas, pero el 10% son tonterías, es demasiado para nosotros».
Google dijo que sus productos ahora admiten 133 idiomas. Los últimos 24 son el lote más grande que se agregó desde que Google agregó 16 nuevos idiomas en 2010. Lo que hizo posible la expansión fue lo que Google llama un modelo de «Traducción automática de parada cero», un modelo de IA que aprende a traducir a otro. idioma. sin ver nunca un ejemplo.
Meta, la empresa matriz de Facebook e Instagram, presentó el año pasado un concepto similar llamado Traductor de voz universal.
«En un nivel alto, la forma en que puedes imaginar que funciona es que tienes un modelo neuronal gigantesco y está entrenado en 100 idiomas diferentes», dijo Caswell sobre el modelo de Google.
Dijo que el nuevo grupo abarcaba desde idiomas más pequeños como el mizo, hablado en el noreste de la India por unas 800.000 personas, hasta idiomas más hablados como el lingala, hablado por unos 45 millones de personas en África central.
Hace más de 15 años, en 2006, Microsoft recibió atención positiva en América del Sur con funcionalidad de software que traduce menús y comandos familiares de Microsoft al quechua. Pero eso fue antes de la ola actual de avances de IA en la traducción en tiempo real.
Américo Mendoza, spécialiste des langues à l’Université de Harvard, qui parle le quechua, a déclaré que l’attention de Google apportait une visibilité nécessaire à la langue dans des endroits comme le Pérou, où les locuteurs du quechua manquent encore dans de nombreux servicios públicos. La supervivencia de muchos de estos lenguajes “dependerá de su uso en contextos digitales”, dijo.
Los nuevos idiomas agregados son: asamés, aymara, bambara, bhojpuri, dhivehi, dogri, ewe, guaraní, ilocano, konkani, krio, lingala, luganda, maithili, meiteilon (manipuri), mizo, oromo, quechua, sánscrito, sepedi, Sorani Kurdish, Tigrinya, Tsonga y Twi.
—-
O’Brien informó desde Providence, Rhode Island.
«Aficionado a los viajes. Wannabe explorer. Galardonado experto en televisión. Analista apasionado. Emprendedor».