dis9034-2024-1

clase-15

Investigación sobre Speech p5

Speech P5 - Creador Luke DuBois

la web está en https://idmnyu.github.io/p5.js-speech/

p5.speech: Es una extensión de p5 para proporcionar una funcionalidad Web de síntesis y reconocimiento. Consta de dos clases de objetos uno es p5.Speech y el otro p5.SpeechRe. Junto con funciones de acceso para hablar y escuchar texto, cambiar parámetros como diferentes voces de síntesis, modelos de reconocimiento, entre otros. Esta herramienta da acceso simple y claro a las APIs de habla web, permitiendo la creación de bosquejos sencillos que pueden hablar y escuchar.

El reconocimiento de voz requiere el lanzamiento desde un servidor usando HTTPS (por ejemplo, usando un servidor python en una máquina local).

HTTPS: Es el protocolo de transferencia de hipertexto seguro, se caracteriza por ser el  principal protocolo utilizado para enviar datos entre un navegador web y un sitio web de forma segura.

Web Speech API permite incorporar datos de voz en aplicaciones web.

La API Web Speech tiene dos partes

img ss1

Ejemplos de speech funcionales
  1. En esta web puedes hablar mediante el micrófono de tu dispositivo y lo que digas será transcrito con este speech. Acepta palabras acotadas y va de una palabra en una. También al transcribir la palabra escuchada el canvas de fondo cambia a color verde.

    interacción: img ss2

    resultado: img ss3

  2. En esta web puedes presionar en diferentes lugares del canvas y sonara un sonido o palabra, según el lugar que oresiones este cambiara su tono o palabra / expresión.

https://github.com/disenoUDP/dis9034-2024-1/raw/main/estudiantes/17-ignaojeda/clase-15/videoFuncionamiento.mov

Líneas de código
p5.Speech
p5.SpeechRec

Estas descripciones fueron citadas y traducidas desde este link de github de IDMNYU https://idmnyu.github.io/p5.js-speech/

Fuentes utilizadas: