Los desarrolladores y las empresas utilizan cada vez más agentes de inteligencia artificial y chatbots en sus aplicaciones, pero hasta ahora se han limitado principalmente a texto. Lemon Slice, empresa de generación de avatares digitales, está trabajando para añadir una capa de vídeo a estos chats con un nuevo modelo de distribución que permite crear avatares digitales a partir de una única imagen.
El modelo, llamado Lemon Slice-2, puede crear un avatar digital construido sobre una base de conocimientos y asumir cualquier función requerida por el agente de IA, como responder consultas de clientes, ayudar con preguntas sobre tareas o incluso trabajar como agente de apoyo a la salud mental.
“En los primeros días de GenAI, mis cofundadores comenzaron a jugar con diferentes modelos de video y nos dimos cuenta de que los videos serían interactivos. Lo atractivo de herramientas como ChatGPT era que eran interactivas y queremos que los videos tengan ese nivel”, dijo la cofundadora Lina Colucci.
Según Lemon Slice, es un modelo de 20 mil millones de parámetros que puede funcionar en una sola GPU para transmitir video en vivo a 20 cuadros por segundo. La empresa pone el modelo a disposición a través de una API y un widget integrable que las empresas pueden integrar en sus sitios web con una sola línea de código. Una vez creado un avatar, puedes cambiar el fondo, el estilo y la apariencia de un personaje en cualquier momento.
Además de avatares con apariencia humana, la empresa también se centra en poder generar personajes no humanos para diferentes necesidades. La startup utiliza la tecnología de ElevenLabs para generar las voces de estos avatares.
Fundada en 2024 por Lina Colucci, Sidney Primas y Andrew Weitz, Lemon Slice cree que se diferenciará de la competencia mediante el uso de su propio modelo de difusión de propósito general (un tipo de modelo generativo que aprende a trabajar hacia atrás a partir de datos de entrenamiento ruidosos para generar nuevos datos) para crear avatares.
“Las soluciones de avatar existentes que he visto hasta ahora han añadido un valor negativo al producto”, afirmó Colucci. “Son espeluznantes y rígidos. Se ven bien durante unos segundos, y una vez que empiezas a interactuar con ellos, se siente muy espeluznante y no te tranquiliza. Lo que impidió que los Avatares realmente despegaran es que no eran lo suficientemente buenos”.
Evento tecnológico
san francisco
|
13 al 15 de octubre de 2026
Para financiar estos esfuerzos, la compañía anunció el martes que ha recaudado 10,5 millones de dólares en capital inicial de Matrix Partners, Y Combinator, el CTO de Dropbox, Arash Ferdowsi, el CEO de Twitch, Emmett Shear, y The Chainsmokers.
La compañía dice que cuenta con medidas de seguridad para evitar la clonación no autorizada de rostros o voces y que utiliza grandes modelos de lenguaje para moderar el contenido.
Lemon Slice se negó a nombrar las organizaciones que utilizan su tecnología, pero dijo que el modelo se utilizará para casos de uso como educación, aprendizaje de idiomas, comercio electrónico y capacitación corporativa.
La startup se enfrenta a una fuerte competencia de startups de generación de vídeos como D-ID, HeyGen y Sythesia, así como de otros creadores de avatares digitales como Genies, Soul Machine, Praktika y AvatarOS.
Ilya Sukhar, socio de Matrix, cree que los avatares serán útiles en áreas donde el vídeo está a la vanguardia. Por ejemplo, la gente prefiere aprender en YouTube en lugar de leer largos bloques de texto. Señaló que las capacidades técnicas de Lemon Slice y sus propias capacidades le darán una ventaja sobre otras nuevas empresas.
“Es un equipo profundamente técnico con un historial de entrega de productos de aprendizaje automático, no solo demostraciones e investigación. Muchos de los otros actores están diseñados para escenarios o industrias específicas, y Lemon Slice toma la amarga lección general (de datos y computación) del enfoque de escalamiento que ha funcionado para otras modalidades de IA”, dijo.
Jared Friedman de Y-Combinator cree que Lemon Slice puede generar cualquier tipo de avatar utilizando un modelo de difusión, a diferencia de otras startups que se centran en avatares de apariencia humana o de personajes de juegos.
“Lemon Slice es, en mi opinión, la única empresa que adopta el enfoque básico de ML y finalmente puede superar el valle inquietante y superar la prueba de Avatar Turing. Entrenan el mismo tipo de modelo que Veo3 o Sora: un transformador de difusión de vídeo. Debido a que es un modelo de propósito general que hace todo de principio a fin, no hay límite superior de lo bueno que puede ser; los otros están por debajo de los máximos fotorrealistas. También funciona para rostros humanos y no humanos y solo requiere agregar una imagen”. una cara nueva”, dijo.
La startup emplea actualmente a ocho personas y planea utilizar los fondos para contratar ingenieros y personal de comercialización, así como pagar las facturas computacionales para entrenar sus modelos.