Subscribe to our YouTube channel
La inteligencia artificial y la robótica siguen avanzando a pasos agigantados, y esta vez Hugging Face ha dado un golpe sobre la mesa. La reconocida plataforma de desarrollo de IA presentó su nuevo modelo llamado SmolVLA, una solución de visión-lenguaje-acción (VLA) que promete democratizar el acceso a la robótica de manera sorprendente: ¡es tan eficiente que puede ejecutarse en una simple MacBook!
¿Qué es SmolVLA?
SmolVLA es un modelo con 450 millones de parámetros, entrenado con datos compartidos por la comunidad a través del ecosistema “LeRobot” de Hugging Face. Pese a su tamaño modesto en comparación con gigantes del sector, este modelo supera en rendimiento a otras soluciones más grandes tanto en entornos virtuales como reales.
Su eficiencia no se limita a su capacidad computacional. Una de sus mayores innovaciones es el uso de una pila de inferencia asíncrona, que permite al modelo separar el procesamiento de acciones de lo que el robot ve y escucha. ¿El resultado? Robots que responden más rápido en entornos cambiantes y complejos, algo fundamental para tareas de automatización en el mundo real.
Una revolución para la robótica accesible
Con SmolVLA, Hugging Face busca acelerar la investigación y el desarrollo de agentes robóticos generalistas, es decir, sistemas que puedan ejecutar múltiples tareas de forma flexible. Lo mejor es que este modelo puede probarse en hardware asequible, lo que abre la puerta a desarrolladores, makers y startups que no cuentan con recursos millonarios.
SmolVLA ya está disponible para descarga desde la plataforma de Hugging Face, y las primeras pruebas ya muestran resultados prometedores. Un usuario incluso ha logrado controlar un brazo robótico de terceros usando este modelo, marcando un hito en la integración rápida de IA y robótica.
Un ecosistema que no para de crecer
Este avance forma parte de una visión más amplia por parte de Hugging Face. Tras la adquisición de la startup francesa Pollen Robotics, la empresa ha lanzado robots humanoides económicos, herramientas y datasets abiertos para fomentar una comunidad robusta e inclusiva en el desarrollo de robótica.
El futuro es abierto y colaborativo
La competencia en el terreno de la robótica de código abierto está en auge. Empresas como Nvidia, Physical Intelligence (respaldada por Jeff Bezos) y startups como K-Scale Labs también están construyendo sus propias visiones del futuro. Sin embargo, Hugging Face parece llevar la delantera con un enfoque claro: poner el poder de la robótica al alcance de todos.