
Facebook anunció el jueves un proyecto de investigación en el que recopiló 2.200 horas de imágenes en primera persona de todo el mundo para entrenar modelos de inteligencia artificial de próxima generación.
El proyecto se llama Ego4D y podría resultar crucial para la división Reality Labs de Facebook, que está trabajando en numerosos proyectos que podrían beneficiarse de modelos de inteligencia artificial entrenados utilizando secuencias de video tomadas desde la perspectiva de un humano. Esto incluye gafas inteligentes, como las Ray-Ban Stories que fueron lanzadas por Facebook el mes pasado , y la realidad virtual, en la que Facebook ha invertido mucho desde su adquisición de Oculus por $ 2 mil millones en 2014.
El metraje podría enseñar a la inteligencia artificial a comprender o identificar algo en el mundo real, o en un mundo virtual, que podrías ver desde una perspectiva en primera persona a través de un par de anteojos o un visor Oculus.
Facebook dijo que pondrá el conjunto de datos de Ego4D a disposición del público para los investigadores en noviembre.
“Este lanzamiento, que es un conjunto de datos abiertos y un desafío de investigación, catalizará el progreso para nosotros internamente, pero también de manera generalizada externamente en la comunidad académica y [permitirá] a otros investigadores respaldar estos nuevos problemas, pero ahora podrán hacerlo en de una manera más significativa ya mayor escala ”, dijo investigadora científica principal de Facebook.
El conjunto de datos podría implementarse en modelos de inteligencia artificial utilizados para entrenar tecnología como robots para comprender más rápidamente el mundo.
“Tradicionalmente, un robot aprende haciendo cosas en el mundo o siendo literalmente portátil para que le enseñen cómo hacer las cosas”, “Hay oportunidades para que aprendan de los videos solo de nuestra propia experiencia”.
Facebook y un consorcio de 13 universidades asociadas contaron con más de 700 participantes en nueve países para capturar las imágenes en primera persona. Facebook dice que Ego4D tiene más de 20 veces más horas de metraje que cualquier otro conjunto de datos de este tipo.
Los socios universitarios de Facebook incluyeron Carnegie Mellon en los EE. UU., La Universidad de Bristol en el Reino Unido, la Universidad Nacional de Singapur, la Universidad de Tokio en Japón y el Instituto Internacional de Tecnología de la Información en India, entre otros.
El metraje fue capturado en los EE. UU., Reino Unido, Italia, India, Japón, Singapur y Arabia Saudita. Facebook dijo que espera expandir el proyecto a más países, incluidos Colombia y Ruanda.
Una decisión de diseño importante para este proyecto es que queríamos socios que, en primer lugar, fueran expertos líderes en el campo, interesados en estos problemas y motivados para perseguirlos, pero que también tuvieran diversidad geográfica.

El anuncio de Ego4D llega en un momento interesante para Facebook.
La compañía ha ido aumentando constantemente sus esfuerzos en hardware. El mes pasado, lanzó Ray-Ban Stories de 299 dólares, sus primeras gafas inteligentes. Y en julio , Facebook anunció la formación de un equipo de producto para trabajar específicamente en el “metaverso”, que es un concepto que implica la creación de mundos digitales en los que varias personas pueden habitar al mismo tiempo.
Sin embargo, durante el mes pasado, Facebook se ha visto afectada por un aluvión de noticias derivadas de un tesoro de investigaciones internas de la empresa filtradas por Frances Haugen , una exgerente de producto de Facebook que se convirtió en denunciante. Entre las investigaciones publicadas había diapositivas que mostraban que Instagram era perjudicial para la salud mental de los adolescentes.
El metraje fue capturado usando dispositivos estándar como cámaras GoPro y lentes inteligentes Vuzix .
Por el bien de la privacidad, Facebook dijo que los participantes recibieron instrucciones de evitar capturar características de identificación personal al recopilar imágenes en interiores. Esto incluye rostros, conversaciones, tatuajes y joyas de las personas. Facebook dijo que eliminó la información de identificación personal de los videos y borró los rostros de los transeúntes y los números de las placas de los vehículos. El audio también se eliminó de muchos de los videos, dijo la compañía.
“Los socios universitarios que hicieron esta recopilación de videos, el paso número uno para todos ellos, fue un proceso bastante intenso e importante para crear una política para la recopilación adecuada”
Fuente: CNBC