Así funciona ‘Jarvis’, el mayordomo virtual de Mark Zuckerberg
El ejecutivo ha sido capaz de crear un sistema de inteligencia artificial que comprende la voz y el contexto como uno de sus propósitos de año nuevo.
El CEO de Facebook, Mark Zuckerberg
Mark Zuckerberg se toma muy en serio sus propósitos de año nuevo. Su continua búsqueda de retos para “aprender nuevas cosas y crecer”, según sus propias palabras, le sirven para evadirse de su asfixiante rol como presidente y consejero delegado de Facebook. Aprender chino mandarín, conocer personas diferentes e interesantes cada día o leer dos libros al mes son algunos de la multitud de propósitos que ha cumplido y que ha compartido en la red social que creó cuando era un universitario.
El filántropo estadounidense se ha convertido en un ejecutivo, pero siempre ha sido, por encima de todo, un programador. Por ello, aprovecha cualquier hackaton o pequeño proyecto para involucrarse. Su propósito para 2016 era diseñar una inteligencia artificial sencilla con la que controlar su casa: una especie de mayordomo virtual que da vida a Jarvis, la entidad artificial que vive dentro del traje de Iron Man, para controlarlo en las películas de Marvel.
Su propósito para 2016 era diseñar una inteligencia artificial sencilla con la que controlar su casa: una especie de mayordomo virtual que da vida a Jarvis.
Su primer contacto con la inteligencia artificial fue con 18 años, justo antes de entrar en Harvard. Fue entonces cuando lanzó junto a su compañero Adam D’Angelo Synapse Media Player, un reproductor de canciones con una peculiaridad totalmente rompedora para la época: la música que reproducía era seleccionada por la preferencia del usuario y sus escuchas previas. Se convirtió en su primer éxito, pero decidió ofrecerlo de manera gratuita y compartirlo en lugar de venderlo a los múltiples interesados (entre los que se encontraba el gigante Microsoft).
La nueva meta del creador de Facebook es ya, a falta de poco más de una semana para que acabe el año, completamente funcional. Zuckerberg puede hablar a Jarvis a través de su ordenador y teléfono para que controle las luces, la temperatura, el reproductor músical y las cámaras de seguridad de su casa. Distinguir a los miembros de la familia Zuckerberg y aprender de sus preferencias y patrones es lo que hace al robot especial.
Jarvis incluye varios paradigmas de inteligencia artificial, como el procesado y comprensión del lenguaje natural, el reconocimiento facial y de voz, y, lo más importante, la capacidad de aprender con la experiencia.
Conectar el hogar, primera piedra en el camino
El primer objetivo a implementar fue el de conectar todos los dispositivos de su casa. Aunque aparentemente pueda parecer la parte más sencilla, se convirtió en uno de los procesos que más complicaciones le produjo, según reconoce el propio Zuckerberg en su entrada en Facebook.
Antes de comenzar con los algoritmos de inteligencia artificial, necesitó escribir código para todos y cada uno de los dispositivos conectados, ya que cada uno “habla” lenguajes y protocolos distintos. Un altavoz Sonos, un televisor Samsung o una cámara Nest son dispositivos que solo obedecen al mando o aplicación que les da órdenes, problema que tuvo que solventar para que todos los mecanismos pudieran ser comandados a través de un solo ordenador conectado a internet.
Por si fuera poco, un nuevo obstáculo se interpuso en el camino de Zuckerberg. La mayoría de electrodomésticos no cuentan con conexión a Internet, lo que le llevó entonces a adaptar cada uno de ellos para poder comenzar a ponerse manos a la obra con el cerebro de su proyecto de inteligencia artificial. Lograr que, por ejemplo, su tostador se encienda y baje la rebanada de pan a través de una llamada realizada desde el ordenador fue uno de esos pequeños pasos necesarios para poder acometer su objetivo mayor.
“Necesitamos más dispositivos conectados y que la industria desarrolle APIs y estándares que permitan a los dispositivos hablar entre sí”, concluyó el estadounidense en el proceso.
Hacer que Jarvis entienda el lenguaje natural
Que una máquina entienda el lenguaje humano es el primer y más importante avance a la hora de hacer de los algoritmos de inteligencia artificial algo personal. Apple con Siri, Google con Assistant, Microsoft con Cortana y Amazon con Alexa enfocan sus progresos en esta dirección, ya que es la única vía de comunicación entre sus potentes máquinas y algoritmos y una simple petición, que pudiera ser malinterpretada debido a la dependencia del contexto en la comunicación interpersonal.
Jarvis incluye varios paradigmas de inteligencia artificial, como el procesado y comprensión del lenguaje natural.
Con esa meta como propósito, Jarvis pasó de realizar acciones simples, como encender la luz en la habitación X a realizar acciones por determinado contexto. Consigue ser capaz de atenuar las luces sin especificar donde al saber cuál es la habitación en la que se encendieron las luces por última vez, con lo que logra adivinar la habitación en la que está Zuckerberg o su esposa. Un dispositivo cuya inteligencia artificial hace que la ventaja que nos proporciona nos llegue a resultar espontánea y consigamos evadirnos de ciertas necesidades. Y es que nuestro hogar está diseñado para saberlo por nosotros, evitando nuestra propia interacción.
La nueva creación del empresario estadounidense es capaz de interpretar órdenes simples para las personas pero muy complejas para una máquina debido a su inexactitud. No es lo mismo decir “reproduce Someone like you” que “reproduce algo como Adele” o “reproduce algo de Adele”. La primera solicita una canción, la segunda un artista similar y la tercera crear una lista de reproducción con lo mejor de Adele. Gracias a la creación de un sistema de aprendizaje, Jarvis puede aprender del feedback que le dan sus usuarios para comprender estas diferencias.
La mayoría de electrodomésticos no cuentan con conexión a Internet, lo que le llevó entonces a adaptar cada uno de ellos.
“A más contexto tenga, mejor podrá interpretar las órdenes no específicas”, dice Zuckerberg, que presume, sin pretenderlo, de haber creado un algoritmo capaz de reproducir la música que quieres a través de tu historial de reproducciones, feedback y del contexto de ese momento.
Jarvis también distingue la voz de su mujer de la de él. Cada miembro de la familia tiene un historial, patrón y preferencias asociados y todas sus órdenes son interpretadas aunque no expresen algo con exactitud.
“He descubierto que usamos órdenes no concretas muchas más veces que específicas. No hay ningún producto comercial ahora mismo que las interprete, y parece una gran oportunidad”, dice Zuckerberg.
Hacer que Jarvis vea y escuche
Para lograr que Jarvis vea, el joven ejecutivo instaló multitud de cámaras que recogieran casi todos los ángulos. Conectadas a un servidor, buscan constantemente caras que reconocer. Una vez detectadas, la información llega al servidor y concluye si es un amigo de Zuckerberg. Esta fue una de las tareas más sencillas, ya que Facebook lleva mucho tiempo trabajando en la detección de caras para el etiquetado de fotos en su red social.
Los ojos de Jarvis le aportan contexto: sabe cuando su hijo se despierta o donde está trabajando Zuckerberg para que, si ordena “encender las luces”, el mayordomo virtual sepa sobre qué habitación actuar sin dar una orden específica.
Comunicarse a través de Messenger
El presidente de Facebook programó a Jarvis en su ordenador, pero necesitaba una forma de comunicarse con él en cualquier lugar, así que decidió programar un bot de Messenger para enviarle órdenes. Gracias a ello ha sido capaz de enviarle notas de voz y que el servidor las transforme en texto.
Jarvis es proactivo y capaz de enviar la foto de las personas que se acercan a su casa a través de Messenger cuando él no está.
Jarvis pasó de realizar acciones simples, como encender la luz en la habitación X a realizar acciones por determinado contexto.
“Escribo mucho más de lo que esperaba”, dice Zuckerberg, que cree que, pese a que todo Silicon Valley esté centrado en la voz, dar órdenes a través de un chat es vital. “Lo hago mediante texto por varias razones, pero la principal es que hablar puede molestar a las personas que están a mi alrededor”, explica. “Siempre he sido optimista con respecto a los bots de inteligencia artificial, pero ahora lo soy mucho más y creo que todos nos comunicaremos con asistentes como Jarvis en el futuro”.
El problema y oportunidad de la voz
Para poder hablar a Jarvis sin tener que enviar una nota de voz, Zuckerberg ha programado una aplicación para iOS que permanece siempre a la escucha.
Detectó que, aunque la mejora en los últimos años es inmensa, ningún sistema de inteligencia artificial es capaz todavía de entender una conversación. La comprensión depende aún de una comunicación con una estructura muy concreta.
Cada miembro de la familia tiene un historial, patrón y preferencias asociados y todas sus órdenes son interpretadas.
Otra de sus conclusiones fue que los sistemas de aprendizaje automáticos están optimizados para resolver problemas mucho más específicos de lo que la gente puede pensar. Por ejemplo, si entrenas un sistema con datos procedentes de Google, no entenderá muy bien a las personas que hablan a otras personas en Facebook.
“En el caso de Jarvis, entrenar una inteligencia artificial que siempre te acompaña es diferente a una que reside inmóvil en una habitación, como Echo de Amazon. Estos dispositivos están mucho más especializados de lo que parece, e implica que todavía estamos muy lejos de ofrecer sistemas más generales y aptos para todo tipo de situaciones”, concluyó Zuckerberg.
Inteligencia artificial: más cerca y más lejos de lo que pensamos
Zuckerberg ha dedicado 100 horas a programar Jarvis este año, un sistema que puede aprender cosas básicas y realizar todas las tareas que necesita realizar en su casa. Pero reconoce que, aunque hubiera invertido 1.000 horas más, su sistema seguiría sin ser verdaderamente inteligente: no sería capaz de aprender cosas por sí mismo.
Otra de sus conclusiones fue que los sistemas de aprendizaje automáticos están optimizados para resolver problemas mucho más específicos de lo que la gente puede pensar.
“En cierta manera, la inteligencia artificial está más cerca y más lejos de lo que imaginamos. Está más cerca de realizar cosas más trascendentes de lo que la gente piensa, como conducir por nosotros, ofrecer tratamientos a enfermedades o descubrir planetas. Estas cosas cambiarán el mundo, pero todavía estamos intentando saber qué es la inteligencia realmente”, dice Zuckerberg.
Al responder a uno de sus lectores, el ejecutivo explicó lo que para él es la inteligencia artificial: “Esa es la gracia de la inteligencia artificial. Es casi magia. Llamamos inteligencia artificial a lo que no podemos comprender todavía. En cuanto lo hacemos, se convierten en simples matemáticas”.