Este programa, denominado Language Technology Partner Program, busca reunir a colaboradores que puedan aportar grabaciones de voz y transcripciones, grandes cantidades de textos escritos y conjuntos de frases traducidas en una variedad de idiomas. La iniciativa está dirigida a crear modelos de reconocimiento de voz y traducción que, una vez finalizados, serán de código abierto.
El principal objetivo de esta colaboración es apoyar los esfuerzos de UNESCO para promover el uso de tecnologías lingüísticas en idiomas poco representados, especialmente aquellos que se enfrentan a una falta de recursos tecnológicos. Meta explica que, a través de este programa, busca integrar las lenguas menos favorecidas en modelos de IA que puedan comprender y responder a necesidades humanas complejas sin importar el idioma o contexto cultural.
Actualmente, uno de los primeros colaboradores del programa es el gobierno de Nunavut, una región del norte de Canadá, conocida por su baja densidad de población y la diversidad lingüística de sus habitantes. En esta zona, se hablan lenguas indígenas conocidas como Inuktut, lo que hace que este programa sea aún más relevante para preservar y digitalizar idiomas minoritarios.
Como parte de este esfuerzo, Meta también ha anunciado la publicación de un benchmark de traducción automática de código abierto. Este benchmark tiene como objetivo evaluar el rendimiento de los modelos de traducción de lenguas y está compuesto por un conjunto de frases desarrolladas por lingüistas. El benchmark está disponible en siete idiomas y puede ser utilizado y ampliado por la comunidad a través de la plataforma de desarrollo de IA, Hugging Face.
A través de estas iniciativas, Meta busca mejorar sus modelos de IA, beneficiándose de sistemas de traducción y reconocimiento de voz más precisos y accesibles. Además, el programa se presenta como un esfuerzo filantrópico que permitirá a Meta obtener datos valiosos que pueden utilizarse para perfeccionar las capacidades de su asistente de IA, Meta AI, que continúa expandiendo la cantidad de lenguas que soporta.
El lanzamiento de estas iniciativas también tiene implicaciones en la moderación de contenido y la gestión de la desinformación en múltiples idiomas.