Un equipo de investigadores de Meta ha creado Husky, un agente lingüístico de código abierto que, en lugar de enfocarse en una única tarea, ha sido diseñado para llevar a cabo tareas de razonamiento complejas utilizando diversas herramientas.
Los agentes lingüísticos suelen caracterizarse por el uso de modelos de lenguaje grande (LLM) propietarios o por estar dirigidos a tareas específicas dentro de un dominio concreto. No obstante, los investigadores de Meta, en colaboración con la Universidad de Washington y el Instituto Allen para la Inteligencia Artificial, van un paso más allá, dándole un enfoque innovador.
El nuevo agente lingüístico de código abierto de Meta, Husky, es capaz de razonar sobre un espacio de acción unificado para abordar un conjunto diverso de tareas complejas que involucran razonamiento numérico, tabular y basado en el conocimiento.
En cuanto a su mecanismo, Husky utiliza un procedimiento en dos partes: la generación de la acción, que predice la acción y la herramienta que la ejecuta; y la ejecución de la acción, durante la cual el modelo y la herramienta llevan a cabo la acción y actualizan el estado de la solución utilizando una ontología predefinida de acciones hasta alcanzar el estado final.
Para abordar cada tarea, Husky descompone la misma en una serie de acciones, utilizando herramientas específicas para su ejecución hasta completar la tarea o alcanzar el estado final. Los investigadores han destacado que, a pesar de utilizar modelos de lenguaje grande (LLM) de 7.000 millones de parámetros, el rendimiento de Husky iguala o supera al de otros modelos de lenguaje frontera, como GPT-4, en las tareas analizadas.
Finalmente, los investigadores han dicho que su "trabajo presenta una receta sólida para la creación de agentes lingüísticos de código abierto que generalizan diferentes tipos de tareas de razonamiento de varios pasos".