Meta, la empresa propietaria de Facebook, anunció el lanzamiento de nuevos modelos de inteligencia artificial (IA) desarrollados por su división de investigación. Entre estos modelos destaca un "evaluador autodidacta", diseñado para reducir la necesidad de intervención humana en el desarrollo de IA.
Este modelo fue presentado inicialmente en un artículo publicado en agosto, donde se explicó que se basa en la técnica de "cadena de pensamiento", similar a la que utiliza OpenAI en sus modelos o1. Esta técnica descompone problemas complejos en pasos más sencillos, lo que permite mejorar la precisión de las respuestas, especialmente en áreas como ciencias, programación y matemáticas.
Lo innovador de este evaluador autodidacta es que fue entrenado completamente con datos generados por otros sistemas de IA, eliminando la necesidad de intervención humana durante esa etapa del proceso. Esta capacidad de utilizar IA para evaluar y corregir su propio desempeño abre la posibilidad de crear agentes de IA completamente autónomos que puedan aprender de sus propios errores, según indicaron a Reuters dos investigadores de Meta involucrados en el proyecto.
El objetivo a largo plazo es desarrollar asistentes digitales lo suficientemente inteligentes como para realizar una variedad de tareas sin necesidad de intervención humana. Esto podría transformar la forma en que se entrena la IA actualmente, eliminando la dependencia del proceso conocido como "aprendizaje por refuerzo a partir de la retroalimentación humana". Este método requiere que expertos humanos etiqueten datos y verifiquen las respuestas, un proceso que puede ser costoso y complicado.
Jason Weston, uno de los investigadores de Meta, señaló que el desarrollo de modelos que puedan aprender y evaluarse por sí mismos es clave para alcanzar un nivel de IA que supere las capacidades humanas. Según él, "a medida que la IA se vuelve más avanzada, debería ser capaz de verificar su propio trabajo de manera más precisa, eventualmente superando a los humanos en esta tarea".
Meta no es la única empresa que trabaja en esta área. Google y Anthropic también han estado investigando el concepto de "aprendizaje por refuerzo a partir de la retroalimentación de la IA", donde los modelos de IA se entrenan utilizando datos generados por otras IA. Sin embargo, a diferencia de Meta, estas empresas tienden a no hacer públicos sus modelos para su uso general.
Además del evaluador autodidacta, Meta lanzó otras herramientas de IA. Una de ellas es una actualización de su modelo de identificación de imágenes llamado "Segment Anything", diseñado para mejorar la precisión en la segmentación de imágenes. También se presentó una herramienta que acelera los tiempos de respuesta de los modelos de lenguaje de gran escala (LLM), y nuevos conjuntos de datos que podrían facilitar el descubrimiento de nuevos materiales inorgánicos.
En resumen, Meta está avanzando hacia un futuro en el que la IA no solo pueda realizar tareas complejas, sino también autoevaluarse y mejorar sin la intervención humana. Esto podría representar un cambio significativo en la forma en que se desarrollan y aplican los modelos de IA, con el potencial de crear agentes autónomos más eficientes y precisos.