1. Introducción
Speech Note es una aplicación que permite tomar, leer y traducir notas en varios idiomas. Para ello, ofrece funciones de conversión de voz a texto, texto a voz y traducción automática. Todo el procesamiento de texto y voz se realiza de forma local, sin conexión a Internet, garantizando así la privacidad del usuario. Ningún dato se envía a internet.
2. Instalación
La instalación es muy simple, se realiza mediante el Centro de control de LliureX, a través del menú: Aplicaciones -> Administración LliureX -> Zero Center, Centro de control de LliureX (la imagen puede variar en función de la versión de LliureX o de la personalización aplicada por el usuario)
Después de abrir Zero Center, busca "speech" y sigue los pasos de la instalación.
Una vez instalada, la aplicación Speech ¨Note se encuentra en la categoría de "utilidades" en el menú de LliureX:
Al ejecutar la aplicación se mostrará una ventana con un bloc de notas donde se puede editar texto y donde se puede tanscribir mediante dictado por voz:
3. Configuración
Speech Note tiene muchas opciones de configuración para personalizar su uso. Una opción de configuración que resulta interesante activar es la de mantener un icono en la barra del sistema para acceder a las opciones principales de la aplicación en cualquier momento. Para ello, acceder al menú principal (primer botón de la barra de menú superior):
Selecciona la pestaña de "Interfaz de usuario" y activa la casilla de "Usar icono de la barra del sistema".
Se agregará un icono de acceso a la aplciación en la barra del sistema, que permanecerá ahí aunque se cierre la ventana de Speech Note:
La instalación por defecto de LliureX incluye dos modelos de inteligencia artificial de reconocimiento de voz: FasterWhisper Small en castellano y FasterWhisper Small en valenciano. Al ser modelos pequeños y bastante eficientes no necesitan de mucha potencia de cálculo y tienen una velocidad razonable en equipos con características hardware modestas. No obstante, se pueden instalar otros modelos y otros idiomas. Para ello, pulsa sobre "Idiomas" en el menú superior:
En la parte inferior del bloc de notas se puede seleccionar el modelo (e idioma) que se va a utilizar para la transcripción de voz a texto [1], y del modelo que se va a usar para la lectura mediante conversión de texto a voz [2]. Se pueden descargar modelos adicionales de texto a voz, de voz a texto o de traducción en el menú [3]:
El programa tiene mayor funcionalidad en modo de ventana, que incluye el bloc de notas. Es el modo por defecto al abrir la aplicación o pulsar en el icono de Speech Note en la barra del sistema. Pero también puede utilizarse desde la barra del sistema en forma de menú al hacer clic con el botón derecho del ratón sobre el icono. Esta segunda opción, aunque incluye menos funcionalidad, puede ser más cómodo para transcribir o leer textos desde otras aplicaciones en lugar del bloc de notas de Speech Note. Este es el aspecto que tiene al menú al pulsar sobre el icono de la aplicación en la barra del sistema:
4. Uso
4.1. Transcripción de audio. De voz a texto.
Para transcribir de audio a texto en el bloc de notas basta con seleccionar el modelo (idioma) en la parte inferior de la ventana y pulsar el botón de "Escuchar":
El texto aparecerá en el bloc de notas de la aplicación.
Transcripción del texto a otras aplicaciones.
Si se desea que Speech Note inserte el texto en la aplicación activa, como por ejemplo, LibreOffice, hay que hacerlo desde el menú que aparece al hacer clic con el botón derecho del ratón sobre el icono de Speech Note en la barra del sistema:
Otra opción aleternativa que ofrece el menu es la de enviar el texto al portapapeles.
4.1.1. Modos de escucha
El modo por defecto, al instalar la aplicación, es el de "Una frase": escucha hasta que se produce una pausa en el dictado, pero esto puede cambiarse en la configuración del programa, seleccionando la pestaña "Voz a texto" y eligiendo el modo de escucha:
Las opciones disponible son:
1. "Una frase": Speech Note escuchará hasta que se produzca una pausa en el dictado de unos 4 segundos.
2. "Pulsar y mantener": Speech Note escuchará mientras se está pulsadon el botón de "Escuchar", y terminará al soltarlo. Este modo sólo está disponible para transcribir al bloc de notas y no a la ventana activa.
3. "Siempre encendido": Este modo es el más interesante. La aplicación estará escuchando siempre, hasta que se desactive. Muy útil para dictados largos.
4.2. Extracción de audio desde un fichero de audio o vídeo. Generación de subtítulos.
Speech Note permite transcribir audio desde un archivo en lugar de tomar la entrada desde un micrófono. Una vez seleccionado el idioma y modelo que se va a usar para la transcripción, se accede al menú Fichero -> Importar desde fichero ... y empezará la conversión de audio a texto.
Una opción interesante es la de generación de subtítulos para vídeos. Los pasos son los siguientes:
[1] Elige el idioma y modelo que se va a usar para la generación de texto.
[2] Selecciona el formato Subtítulos SRT. De esta forma se añadirán marcas de tiempo.
[3] Selecciona el menú Fichero -> Importar desde fichero ...
Cuando termine verás el contenido de los subtítulos en el bloc de notas:
Para guardar los subtítulos selecciona el menú Fichero -> Exportar a fichero ...
[4] Pulsa el botón de "Seleccionar fichero" y da un nombre al fichero de subtítulos que se va a generar. Una buena opción es darle el mismo nombre que el archivo de vídeo pero con la extensión .srt
[5] Selecciona el formato de los subtítulos. Uno de los más habituales es SRT
[6] Por último, pulsa el botón "Exportar" y se creará el fichero.
Ahora, si abres el fichero de vídeo, y el archivo de subtítulos está en la misma carpeta y con el mismo nombre pero con la extensión .srt, verás los subtítulos:
4.3. Lectura. De texto a voz
Por defecto, la aplicación no tiene instalado ningún modelo generativo de voz. Pulsa en "Idiomas" en la ventana principal y carga el modelo que te interese:
Elige el idioma en el que estás interesado y selecciona la pestaña "Texto a Voz":
Verás que hay muchas voces disponibles. Selecciona la que más interese (masculina o femenina) y pulsa "Descargar".
En el modo bloc de notas, una vez seleccionada la voz, pulsa el botón de "Leer" para escuchar el audio correspondiente al texto que hay en el área de edición de Speech Note:
Si estás en otra aplicación, y quieres leer un texto, puedes seleccionarlo, copiarlo al portapapeles con Ctrl + C y acceder al menú de Sppech Note y seleccinar "Leer del portapapeles":
Generación de fichero de audio
Si en lugar de escuchar el texto, lo que quieres es generar un archivo de audio, elige la opción del menú Fichero -> Exportar a fichero ...:
[1] Selecciona la pestaña "Exportar a fichero de audio", [2] pulsa el botón de "Cambiar" para elegir la carpeta y el nombre del fichero que quieres generar, y [3] Elige el formato del archivo de audio de entro los disponibles en el desplegable.
4.4. Traducción
Antes de poder realizar traducciones es necesario descargar el modelo de IA para la traducción entre los idiomas disponibles. Pulsa en el menú "Idiomas":
Selecciona el idioma de origen desde el que hay que traducir:
... y luego la pestaña de "Traductor":
Descarga el modelo y ya puedes traducir.
En la ventana principal de Speech Note, selecciona "Traductor":
Verás que hay diversa funcionalidad en esta ventana. El botón más importante es que el hace la traducción:
También hay botones para "leer" el texto en el idioma seleccionado. Ten en cuenta que para poder ller el texto, es necesario tener descargada la voz correspondiente del idioma seleccionado.
Otra funcionalidad que puede ser itneresante es la de "Traducir a medida que se escribe". Fíjate que la funiconalidad y botones son muy parecidos a los de Google Translate, pero con la ventaja de que en Speech Note se hace de forma local, sin conexión a internet y de forma privada.