Nicholas Leonard y Derek Caneja querían desarrollar agentes de voz con IA, pero cuando comenzaron a desarrollar el producto, sintieron que muchos de estos agentes de voz tenían fallas de diseño.
Algunos de estos agentes se crearon utilizando herramientas sin código, lo que significaba que el envío a producción era rápido, pero la calidad del producto a menudo era baja. Otros agentes fueron creados por empresas que tuvieron el tiempo y los recursos para dedicar meses a desarrollar herramientas especializadas. “Los desarrolladores y las empresas necesitaban una alternativa”, dijo Leonard a TechCrunch, y agregó que él y Caneja también reconocieron que el futuro del software sería “codificado, validado y optimizado por agentes de codificación”.
“Estas dos ideas y una visión histórica nos dieron la inspiración para VoiceRun”, dijo Leonard, director ejecutivo de la empresa. Caneja es el CTO de la empresa.
El año pasado decidieron lanzar VoiceRun, una plataforma que permite a los desarrolladores y asistentes de programación lanzar y escalar agentes de voz. Actualmente, muchas de estas plataformas de código bajo permiten la creación de agentes de voz con gráficos visuales, donde las personas hacen clic en los flujos de conversación y escriben indicaciones en campos que luego dictan cómo debe comportarse el agente. Todo eso puede ser difícil de manejar, afirmó Leonard.
VoiceRun, por otro lado, permite a los usuarios programar cómo quieren que se comporten sus agentes de voz, dándoles más flexibilidad a la hora de crear el producto que desean. El código es el lenguaje nativo de los agentes de programación, explicó Leonard. “Hará un trabajo mucho mejor con el código que con una interfaz visual”, dijo Leonard.
Además, los elementos visuales tienen opciones de configuración limitadas. Entonces, por ejemplo, si alguien quiere crear un agente de voz que pueda hablar en un dialecto diferente, esto podría ser más difícil si el fabricante de la interfaz visual no ha desarrollado una característica que pueda manejar esta tarea.
“Pero el código es increíblemente simple”, dijo. “Hay innumerables ejemplos de pequeñas cosas que quizás quieras hacer y que no son compatibles con la interfaz visual”.
Evento tecnológico
san francisco
|
13 al 15 de octubre de 2026
Además de los agentes de codificación, VoiceRun también permite a los usuarios realizar pruebas A/B e implementación instantánea con un solo clic.
La empresa está dirigida a desarrolladores de negocios y ayuda a las empresas, por ejemplo, a integrar la IA en su servicio al cliente o ayudar a las empresas de tecnología a introducir productos basados en voz. Por ejemplo, mencionó haber trabajado con una empresa de tecnología para restaurantes que lanzó un conserje telefónico con inteligencia artificial para reservas de comidas.
La compañía anunció el miércoles el cierre de una ronda inicial de 5,5 millones de dólares liderada por Flybridge Capital.
Existe mucha competencia en el campo de los agentes de IA. Las empresas emergentes en este espacio recaudaron miles de millones de dólares el año pasado (de los muchos miles de millones que han ingresado a las empresas de IA en general). Leonard cree que su empresa está luchando con dos extremos del mercado: hay creadores de voz sin código como Bland y ReTell AI que permiten a los usuarios crear demostraciones rápidamente. También existen herramientas más sofisticadas como LiveKt y Pipecat que brindan a los desarrolladores el “máximo control”. Siente que Voicerun se encuentra en medio de esos dos extremos.
“Ofrecemos una infraestructura de voz global y un ciclo de vida basado en revisiones, al tiempo que mantenemos la propiedad del código y los datos de la lógica empresarial en manos del cliente”, afirmó. “La diferencia clave es que estamos cerrando el círculo en el desarrollo de agentes de codificación de extremo a extremo. Esperamos que los desarrolladores supervisen a los agentes de codificación que escriben código, ejecutan pruebas, implementan y sugieren mejoras”.
En cierto modo, Leonard espera que su producto ayude a los desarrolladores a crear herramientas de agentes de voz, lo que a su vez ayudará a las personas a sentirse más cómodas con las voces automatizadas. Hoy en día, los clientes se sienten “aliviados” cuando un humano contesta el teléfono, “porque la automatización de la voz era frágil e ineficaz”.
Una encuesta de Five9 del año pasado encontró que tres cuartas partes de los encuestados todavía prefieren hablar con un humano cuando se trata de cuestiones de servicio al cliente. Leonard dijo que quería cambiar esa percepción porque “los agentes humanos de hoy tienen sus propias limitaciones”, como las barreras del idioma o la sensación de que las personas están siendo juzgadas.
“Había grandes autos antes del Modelo T, pero no fue hasta la línea de ensamblaje que los vehículos se volvieron omnipresentes”, dijo Leonard. “Hoy en día existen excelentes agentes de voz, pero no serán omnipresentes hasta que se construya la fábrica de agentes de voz. VoiceRun es esa fábrica”.