Demostración

Voces TTS líderes en el mercado

En ReadSpeaker, nos apasiona el desarrollo de voces de muy alta calidad. De hecho, los expertos en TTS califican la voz en inglés de EE.UU. de ReadSpeaker como la más precisa del mercado. Los comentarios entusiastas que recibimos de nuestros clientes confirman que ofrecemos las mejores soluciones TTS del mundo para el éxito de aplicaciones en línea o sin conexión, embebidas o basadas en servidor. Nuestro compromiso de ofrecer soluciones TTS sobresalientes es posible gracias a nuestro exigente proceso de producción, diseñado para garantizar unos niveles de calidad, que han hecho que la tecnología TTS de ReadSpeaker se gane la confianza de clientes en todo el mundo.

Cómo se crean nuestras voces TTS

Para crear nuestros personajes de voz, seleccionamos y grabamos a locutores profesionales. En la base de datos de audio resultante, cada pronunciación se segmenta en partes individuales, como fonemas, sílabas y palabras. Luego aplicamos una técnica denominada síntesis de selección unitaria (USS, según sus siglas en inglés). USS selecciona segmentos (unidades) de voz que se pueden «pegar» de tal manera que se produzca un habla sintética de alta calidad.

El locutor (o locutora) elegido trabaja con nuestro equipo de desarrollo de voces durante varias semanas. Para las grabaciones se utiliza un guion variado, diseñado para incluir todos los patrones de sonido del idioma en desarrollo. El equipo supervisa de cerca el proceso de grabación para comprobar la coherencia en la pronunciación, la acentuación y el estilo.

En la segunda fase de la creación de una voz, se añade marcado para enriquecer las grabaciones existentes. Se anota cada palabra, fonema y acento, así como otros aspectos diversos. Durante este proceso, el equipo técnico despliega su «magia», usando una potente combinación de inteligencia artificial y tecnologías de aprendizaje automático aplicadas a grandes cantidades de datos para optimizar las anotaciones. Nuestras modernas metodologías se ven complementadas por los conocimientos lingüísticos de nuestro equipo. El motor TTS de ReadSpeaker utiliza la base de datos resultante para leer el texto en voz alta con una de nuestras voces TTS.

Así es como nace un nuevo personaje de voz TTS de ReadSpeaker. Sin embargo, el proceso no termina aquí. Una de las características que hacen únicas en el mercado a las voces de ReadSpeaker es nuestro proceso de mejora continua. A través de un sistema de retroalimentación de alta calidad y de un exhaustivo proceso de garantía de calidad realizado por expertos nativos, las imperfecciones se corrigen continuamente.

En paralelo, ReadSpeaker también trabaja en la tecnología texto a voz del futuro, mediante el desarrollo de técnicas basadas en ’deep learning’. En lugar de USS, esta técnica revolucionaria implica la asignación de propiedades lingüísticas a características acústicas mediante redes neuronales profundas (DNN, según sus siglas en inglés). Esta técnica utiliza un proceso de aprendizaje iterativo para minimizar las diferencias objetivamente medibles entre las características acústicas previstas y las observadas en el material usado para el entrenamiento de la máquina. Una de las ventajas de este innovador método de creación de voces TTS (DNN) es que la base de datos acústica puede ser mucho más pequeña que para una voz USS. Esto acelera el desarrollo por ReadSpeaker de nuevas voces inteligentes con un tono todavía más expresivo y realista y con una entonación personalizable.

Voces TTS personalizadas

Si su estrategia es ofrecer una experiencia exclusiva a sus clientes y desea hacer que su marca sea atractiva a un nivel totalmente nuevo, una de las formas más potentes de diferenciarse es utilizando una voz personalizada que le represente. Una voz personalizada diferencia su marca y crea un potente vínculo con sus clientes en sus diversos puntos de comunicación con ellos. Si considera que la voz de un personaje o locutor de prestigio representa mejor a su marca y desea poder utilizarla en cualquier situación, ReadSpeaker puede crear una voz TTS personalizada, gestionada por nuestro moderno motor de voz, para dar a su marca reconocimiento instantáneo en las interacciones por voz con sus usuarios.