Cargando...
 

 Borrador
La información de esta página no es definitiva.

Speech Note

1. Introducción

Speech Note es una aplicación que permite tomar, leer y traducir notas en varios idiomas. Para ello, ofrece funciones de conversión de voz a texto, texto a voz y traducción automática. Todo el procesamiento de texto y voz se realiza de forma local, sin conexión a Internet, garantizando así la privacidad del usuario. Ningún dato se envía a internet.

2. Instalación

La instalación es muy simple, se realiza mediante el Centro de control de LliureX, a través del menú: Aplicaciones -> Administración LliureX -> Zero Center, Centro de control de LliureX (la imagen puede variar en función de la versión de LliureX o de la personalización aplicada por el usuario)

Zero Center

Después de abrir Zero Center, busca "speech" y sigue los pasos de la instalación.
Zero Center Nerd  
Una vez instalada, la aplicación Speech ¨Note se encuentra en la categoría de "utilidades" en el menú de LliureX:

Speech1  

Al ejecutar la aplicación se mostrará una ventana con un bloc de notas donde se puede editar texto y donde se puede tanscribir mediante dictado por voz:

Speech2  

3. Configuración

Speech Note tiene muchas opciones de configuración para personalizar su uso. Una opción de configuración que resulta interesante activar es la de mantener un icono en la barra del sistema para acceder a las opciones principales de la aplicación en cualquier momento. Para ello, acceder al menú principal (primer botón de la barra de menú superior):

Speech3  

Speech4  

Selecciona la pestaña de "Interfaz de usuario" y activa la casilla de "Usar icono de la barra del sistema".

Speech5 Se agregará un icono de acceso a la aplciación en la barra del sistema, que permanecerá ahí aunque se cierre la ventana de Speech Note:

Speech9

La instalación por defecto de LliureX incluye dos modelos de inteligencia artificial de reconocimiento de voz: FasterWhisper Small en castellano y FasterWhisper Small en valenciano. Al ser modelos pequeños y bastante eficientes no necesitan de mucha potencia de cálculo y tienen una velocidad razonable en equipos con características hardware modestas. No obstante, se pueden instalar otros modelos y otros idiomas. Para ello, pulsa sobre "Idiomas" en el menú superior:

Speech6

En la parte inferior del bloc de notas se puede seleccionar el modelo (e idioma) que se va a utilizar para la transcripción de voz a texto [1], y del modelo que se va a usar para la lectura mediante conversión de texto a voz [2]. Se pueden descargar modelos adicionales de texto a voz, de voz a texto o de traducción en el menú [3]:

Speech8
El programa tiene mayor funcionalidad en modo de ventana, que incluye el bloc de notas. Es el modo por defecto al abrir la aplicación o pulsar en el icono de Speech Note en la barra del sistema.  Pero también puede utilizarse desde la barra del sistema en forma de menú al hacer clic con el botón derecho del ratón sobre el icono. Esta segunda opción, aunque incluye menos funcionalidad, puede ser más cómodo para transcribir o leer textos desde otras aplicaciones en lugar del bloc de notas de Speech Note. Este es el aspecto que tiene al menú al pulsar sobre el icono de la aplicación en la barra del sistema:

Speech7

4. Uso

 

4.1. Transcripción de audio. De voz a texto.


Para transcribir de audio a texto en el bloc de notas basta con seleccionar el modelo (idioma) en la parte inferior de la ventana y pulsar el botón de "Escuchar":
Speech10  
El texto aparecerá en el bloc de notas de la aplicación.

Transcripción del texto a otras aplicaciones.

Si se desea que Speech Note inserte el texto en la aplicación activa, como por ejemplo, LibreOffice, hay que hacerlo desde el menú que aparece al hacer clic con el botón derecho del ratón sobre el icono de Speech Note en la barra del sistema:


Speech11  
Otra opción aleternativa que ofrece el menu es la de enviar el texto al portapapeles.

4.1.1. Modos de escucha


El modo por defecto, al instalar la aplicación, es el de "Una frase": escucha hasta que se produce una pausa en el dictado, pero esto puede cambiarse en la configuración del programa, seleccionando la pestaña "Voz a texto" y eligiendo el modo de escucha:
Speech12  

Las opciones disponible son:

1. "Una frase": Speech Note escuchará hasta que se produzca una pausa en el dictado de unos 4 segundos.
2. "Pulsar y mantener": Speech Note escuchará mientras se está pulsadon el botón de "Escuchar", y terminará al soltarlo. Este modo sólo está disponible para transcribir al bloc de notas y no a la ventana activa.
3. "Siempre encendido": Este modo es el más interesante. La aplicación estará escuchando siempre, hasta que se desactive. Muy útil para dictados largos.
 

4.2. Extracción de audio desde un fichero de audio o vídeo. Generación de subtítulos.


Speech Note permite transcribir audio desde un archivo en lugar de tomar la entrada desde un micrófono. Una vez seleccionado el idioma y modelo que se va a usar para la transcripción, se accede al menú Fichero -> Importar desde fichero ... y empezará la conversión de audio a texto.  

Una opción interesante es la de generación de subtítulos para vídeos. Los pasos son los siguientes:

Speech Subtitulos0  
[1] Elige el idioma y modelo que se va a usar para la generación de texto.
[2] Selecciona el formato Subtítulos SRT. De esta forma se añadirán marcas de tiempo.
[3] Selecciona el menú Fichero -> Importar desde fichero ...
Cuando termine verás el contenido de los subtítulos en el bloc de notas:
Speech Subtitulos1  
Para guardar los subtítulos selecciona el menú Fichero -> Exportar a fichero ...
Speech Subtitulos3  
[4] Pulsa el botón de "Seleccionar fichero" y da un nombre al fichero de subtítulos que se va a generar. Una buena opción es darle el mismo nombre que el archivo de vídeo pero con la extensión .srt
[5] Selecciona el formato de los subtítulos. Uno de los más habituales es SRT
[6] Por último, pulsa el botón "Exportar" y se creará el fichero.

Ahora, si abres el fichero de vídeo, y el archivo de subtítulos está en la misma carpeta y con el mismo nombre pero con la extensión .srt, verás los subtítulos:
Speech Subtitulos2  

4.3. Lectura. De texto a voz

Por defecto, la aplicación no tiene instalado ningún modelo generativo de voz. Pulsa en "Idiomas" en la ventana principal y carga el modelo que te interese:
Speech6
Speech13  

Elige el idioma en el que estás interesado y selecciona la pestaña "Texto a Voz":
Speech14  

Verás que hay muchas voces disponibles. Selecciona la que más interese (masculina o femenina) y pulsa "Descargar".

En el modo bloc de notas, una vez seleccionada la voz, pulsa el botón de "Leer" para escuchar el audio correspondiente al texto que hay en el área de edición de Speech Note:
Speech15  

Si estás en otra aplicación, y quieres leer un texto, puedes seleccionarlo, copiarlo al portapapeles con Ctrl + C y acceder al menú de Sppech Note y seleccinar "Leer del portapapeles":
Speech16  

Generación de fichero de audio

Si en lugar de escuchar el texto, lo que quieres es generar un archivo de audio, elige la opción del menú Fichero -> Exportar a fichero ...:
Speech17  
[1] Selecciona la pestaña "Exportar a fichero de audio", [2] pulsa el botón de "Cambiar" para elegir la carpeta y el nombre del fichero que quieres generar, y [3] Elige el formato del archivo de audio de entro los disponibles en el desplegable.

4.4. Traducción

Antes de poder realizar traducciones es necesario descargar el modelo de IA para la traducción entre los idiomas disponibles. Pulsa en el menú "Idiomas":
Speech6  

Selecciona el idioma de origen desde el que hay que traducir:

Speech13  ... y luego la pestaña de "Traductor":
Speech Traductor2  

Descarga el modelo y ya puedes traducir.

En la ventana principal de Speech Note, selecciona "Traductor":
Speech Traductor1  

Verás que hay diversa funcionalidad en esta ventana. El botón más importante es que el hace la traducción:
Speech Traductor3  

También hay botones para "leer" el texto en el idioma seleccionado. Ten en cuenta que para poder ller el texto, es necesario tener descargada la voz correspondiente del idioma seleccionado.

Otra funcionalidad que puede ser itneresante es la de "Traducir a medida que se escribe". Fíjate que la funiconalidad y botones son muy parecidos a los de Google Translate, pero con la ventaja de que en Speech Note se hace de forma local, sin conexión a internet y de forma privada.

 

 

Historial

Mastodon E-Mail