Cargando...
 

Historial: Speech Note

Previsualización de la versión: 43

1. Introducción

Speech Note es una aplicación muy copmpleta que permite tomar, leer y traducir notas en varios idiomas. Para ello, ofrece funciones de conversión de voz a texto, texto a voz y traducción automática. Todo el procesamiento de texto y voz se realiza de forma local, sin conexión a Internet, garantizando así la privacidad del usuario. Ningún dato se envía a internet.

2. Instalación

La instalación de Speech Note es sencilla y se realiza a través del Centro de Control de LliureX. Para ello, sigue estos pasos:

1. Abre el Centro de Control de LliureX desde el menú:
Aplicaciones -> Administración LliureX -> Zero Center (la imagen puede variar en función de la versión de LliureX o de la personalización aplicada por el usuario)

Zero Center

2. En la barra de búsqueda de Zero Center, escribe "speech" y selecciona Speech Note.
Zero Center Nerd 3. Sigue las instrucciones de instalación. 


Una vez instalada, la aplicación aparecerá en la categoría de Utilidades dentro del menú de LliureX.

Speech1  

Al abrir Speech Note, se mostrará una ventana con un bloc de notas donde podrás escribir o transcribir texto mediante dictado por voz.:

Speech2  

3. Configuración

Speech Note cuenta con diversas opciones de configuración para personalizar su uso.

3.1. Icono en la barra del sistema

Para acceder rápidamente a las funciones principales de Speech Note, puedes activar el icono en la barra del sistema:

1. Abre Speech Note y accede al menú principal (primer botón de la barra de menú superior):

Speech3  

Speech4  

2. Selecciona la pestaña "Interfaz de usuario".

3. Activa la opción "Usar icono en la barra del sistema":

Speech5 Se agregará un icono de acceso a la aplicación en la barra del sistema, que permanecerá ahí aunque se cierre la ventana de Speech Note:

Speech9

3.2. Modelos de inteligencia artificial


La instalación por defecto de LliureX incluye dos modelos de inteligencia artificial de reconocimiento de voz: FasterWhisper Small en castellano y FasterWhisper Small en valenciano. Al ser modelos pequeños y bastante eficientes no necesitan de mucha potencia de cálculo y tienen una velocidad razonable en equipos con características hardware modestas. No obstante, se pueden instalar otros modelos y otros idiomas. Para ello, pulsa sobre "Idiomas" en el menú superior:

Speech6

En la parte inferior del bloc de notas se puede seleccionar el modelo (e idioma) que se va a utilizar para la transcripción de voz a texto [1], y del modelo que se va a usar para la lectura mediante conversión de texto a voz [2]. Se pueden descargar modelos adicionales de texto a voz, de voz a texto o de traducción en el menú [3]:

Speech8 Speech Note puede usarse tanto en modo ventana, con el bloc de notas incluido, como desde el icono de la barra del sistema, que ofrece una versión más compacta y rápida para transcribir o leer textos sin abrir la ventana principal.

La forma de acceder a la fiorma compacta es haciendo clic con el botón derecho del ratón sobre el icono de la barra del sistema. Esta segunda opción, aunque incluye menos funcionalidad, puede ser más cómoda para transcribir o leer textos desde otras aplicaciones en lugar del bloc de notas de Speech Note. Este es el aspecto que tiene al menú al pulsar sobre el icono de la aplicación en la barra del sistema:

Speech7

4. Transcripción de audio (voz a texto)


Para transcribir de audio a texto en el bloc de notas basta con seleccionar el modelo (idioma) en la parte inferior de la ventana y pulsar el botón de "Escuchar":
Speech10  
El texto aparecerá en el bloc de notas.

4.1. Transcripción del texto en otras aplicaciones


Si deseas insertar el texto transcrito en otra aplicación (por ejemplo, LibreOffice), haz clic derecho sobre el icono de Speech Note en la barra del sistema y selecciona la opción correspondiente:


Speech11  
Otra opción aleternativa que ofrece el menu es la de enviar el texto al portapapeles.

4.2. Modos de escucha


El modo por defecto, al instalar la aplicación, es el de "Una frase": escucha hasta que se produce una pausa en el dictado, pero esto puede cambiarse en la configuración del programa, seleccionando la pestaña "Voz a texto" y eligiendo el modo de escucha:
Speech12  

Speech Note ofrece tres modos de escucha configurables desde la pestaña "Voz a texto":

1. "Una frase": Escucha hasta que detecta una pausa de unos 4 segundos.
2. "Pulsar y mantener": Transcribe mientras mantienes pulsado el botón "Escuchar". Este modo solo funciona en el bloc de notas.
3. "Siempre encendido": Este modo es el más interesante. Mantiene la escucha activa hasta que la desactives. Es ideal para dictados largos.

5. Transcripción desde archivos de audio o vídeo. Generación de subtítulos.


Speech Note permite transcribir audio desde archivos en lugar de utilizar el micrófono. Para ello, seleccionado el idioma y modelo que se va a usar para la transcripción. Luego, accede al menú Fichero -> Importar desde fichero ... , selecciona el fichero de audio o vídeo y empezará la conversión de audio a texto.  

5.1. Generación de subtítulos


Una opción interesante es la de generación de subtítulos para vídeos. Los pasos son los siguientes:

Speech Subtitulos0  
[1] Elige el idioma y modelo que se va a usar para la generación de texto.
[2] Selecciona el formato Subtítulos SRT. De esta forma se añadirán marcas de tiempo.
[3] Selecciona el menú Fichero -> Importar desde fichero ...
Cuando termine verás el contenido de los subtítulos en el bloc de notas:
Speech Subtitulos1  
Para guardar los subtítulos selecciona el menú Fichero -> Exportar a fichero ...
Speech Subtitulos3  
[4] Pulsa el botón de "Seleccionar fichero" y da un nombre al fichero de subtítulos que se va a generar. Una buena opción es darle el mismo nombre que el archivo de vídeo pero con la extensión .srt
[5] Selecciona el formato de los subtítulos. Uno de los más habituales es SRT
[6] Por último, pulsa el botón "Exportar" y se creará el fichero.

Ahora, si abres el fichero de vídeo, y el archivo de subtítulos está en la misma carpeta y con el mismo nombre pero con la extensión .srt, verás los subtítulos:
Speech Subtitulos2  

6. Lectura (texto a voz)

Por defecto, Speech Note no incluye modelos de síntesis de voz. Para habilitar la lectura en voz alta, pulsa en "Idiomas" en la ventana principal y carga el modelo que te interese:
Speech6
Speech13  

Elige el idioma en el que estás interesado y selecciona la pestaña "Texto a Voz":
Speech14  

Verás que hay muchas voces disponibles. Selecciona la que más interese (masculina o femenina) y pulsa "Descargar".

Una vez descargada una voz, selecciona el texto en el bloc de notas y pulsa el botón "Leer". Podrás escuchar el audio correspondiente al texto que hay en la ventana de edición:
Speech15  

Si estás en otra aplicación, selecciona el texto, cópialo con Ctrl + C, y luego accede al menú de Speech Note en la barra del sistema para elegir "Leer del portapapeles":
Speech16  

6.1. Generación de fichero de audio


Si prefieres guardar el texto como un archivo de audio, elige la opción del menú Fichero -> Exportar a fichero ...:
Speech17  
[1] Selecciona la pestaña "Exportar a fichero de audio", [2] pulsa el botón de "Cambiar" para elegir la carpeta y el nombre del fichero que quieres generar, y [3] Elige el formato del archivo de audio de entro los disponibles en el desplegable.

7. Traducción

Antes de traducir, es necesario descargar el modelo de IA para la traducción. Pulsa en el menú "Idiomas":
Speech6  

Selecciona el idioma de origen desde el que hay que traducir:

Speech13  ... y luego la pestaña de "Traductor":
Speech Traductor2  

Descarga el modelo y ya puedes traducir.

En la ventana principal de Speech Note, selecciona "Traductor":
Speech Traductor1  

Verás que hay diversa funcionalidad en esta ventana. El botón más importante es que el hace la traducción:
Speech Traductor3  

También hay botones para "leer" el texto en el idioma seleccionado. Ten en cuenta que para poder leer el texto, es necesario tener descargada la voz correspondiente del idioma seleccionado.

Otra funcionalidad que puede ser interesante es la de "Traducir a medida que se escribe". Fíjate que la funcionalidad y botones son muy parecidos a los de Google Translate, pero con la ventaja de que en Speech Note se hace de forma local, sin conexión a internet y de forma privada.

 

 

Historial

Avanzado
Información Versión
10:39 alonso_vicbar 47
Ver
2025-01-18 15:42 alonso_vicbar 46
Ver
2025-01-18 15:34 alonso_vicbar 45
Ver
2025-01-18 15:30 alonso_vicbar 44
Ver
2025-01-18 15:30 alonso_vicbar 43
Ver
2025-01-18 13:55 alonso_vicbar 42
Ver
2025-01-18 13:54 alonso_vicbar 41
Ver
2025-01-18 13:52 alonso_vicbar 40
Ver
2025-01-18 13:43 alonso_vicbar 39
Ver
2025-01-18 13:26 alonso_vicbar 38
Ver
2025-01-18 13:26 alonso_vicbar 37
Ver
2025-01-18 13:16 alonso_vicbar 36
Ver
2025-01-18 12:55 alonso_vicbar 35
Ver
2025-01-18 12:54 alonso_vicbar 34
Ver
2025-01-18 12:40 alonso_vicbar 33
Ver
2025-01-18 12:34 alonso_vicbar 32
Ver
2025-01-18 12:00 alonso_vicbar 31
Ver
2025-01-18 11:59 alonso_vicbar 30
Ver
2025-01-18 11:55 alonso_vicbar 29
Ver
2025-01-18 11:53 alonso_vicbar 28
Ver
2025-01-18 11:28 alonso_vicbar 27
Ver
2025-01-18 11:27 alonso_vicbar 26
Ver
2025-01-18 11:05 alonso_vicbar 25
Ver
2025-01-18 10:53 alonso_vicbar 24
Ver
2025-01-18 10:48 alonso_vicbar 23
Ver
  • «
  • 1 (actual)
  • 2

Historial

No hay registros que mostrar
Mastodon E-Mail