Cargando...
 

Historial: Speech Note.

Previsualización de la versión: 2

1. Introducció

Speech Note és una aplicació molt completa que permet prendre, llegir i traduir notes en diversos idiomes. Per a això, oferix funcions de conversió de veu a text, text a veu i traducció automàtica. Tot el processament de text i veu es realitza de manera local, sense connexió a Internet, garantint així la privacitat de l'usuari. Cap dada s'envia a internet.

2. Instal·lació

La instal·lació de Speech Note és senzilla i es realitza a través del Centre de Control de LliureX. Per a això, seguix estos passos:

1. Obri el Centre de Control de LliureX des del menú:
Aplicacions -> Administració LliureX -> Zero Center (la imatge pot variar en funció de la versió de *LliureX o de la personalització aplicada per l'usuari)

Zero Center

2. En la barra de busca de Zero Center, escriu "speech" i selecciona Speech Note.
Zero Center Nerd 3. Seguix les instruccions d'instal·lació.

Una vegada instal·lada, l'aplicació apareixerà en la categoria d'Utilitats dins del menú de LliureX.

Speech1  

En obrir Speech Note, es mostrarà una finestra amb un bloc de notes on podràs escriure o transcriure text mitjançant dictat per veu:

Speech2  

3. Configuració

Speech Note compta amb diverses opcions de configuració per a personalitzar el seu ús.

3.1. Icona en la barra del sistema

Per a accedir ràpidament a les funcions principals de Speech Note des de la icona en la barra del sistema:

1. Obri Speech Note i accedix al menú principal (primer botó de la barra de menú superior):

Speech3  

Speech4  

2. Selecciona la pestanya "Interfície d'usuari".

3. Activa l'opció "Usar icona en la barra del sistema":

Speech5 S'agregarà una icona d'accés a l'aplicació en la barra del sistema, que romandrà ací encara que es tanque la finestra de Speech Note:

Speech9

3.2. Models d'intel·ligència artificial

La instal·lació per defecte de LliureX inclou dos models d'intel·ligència artificial de reconeixement de veu: FasterWhisper Small en castellà i FasterWhisper Small en valencià. En ser models xicotets i bastant eficients no necessiten de molta potència de càlcul i tenen una velocitat raonable en equips amb característiques maquinari modestes. No obstant això, es poden instal·lar altres models i altres idiomes. Per a això, polsa sobre "Idiomes" en el menú superior:

Speech6

En la part inferior del bloc de notes es pot seleccionar el model (i idioma) que s'utilitzarà per a la transcripció de veu a text [1], i del model que s'usarà per a la lectura mitjançant conversió de text a veu [2]. Es poden descarregar models addicionals de text a veu, de veu a text o de traducció en el menú [3]:

Speech8 Speech Note pot usar-se tant en mode finestra, amb el bloc de notes inclòs, com des de la icona de la barra del sistema, que oferix una versió més compacta i ràpida per a transcriure o llegir textos sense obrir la finestra principal.

La manera d'accedir al mode compacte és fent clic amb el botó dret del ratolí sobre la icona de la barra del sistema. Esta segona opció, encara que inclou menys funcionalitat, pot ser més còmoda per a transcriure o llegir textos des d'altres aplicacions en lloc del bloc de notes de Speech Note. Este és l'aspecte que té al menú en polsar sobre la icona de l'aplicació en la barra del sistema:

Speech7

4. Transcripció d'àudio (veu a text)

Per a transcriure d'àudio a text en el bloc de notes n'hi ha prou amb seleccionar el model (idioma) en la part inferior de la finestra i polsar el botó de "Escoltar":
Speech10  El text apareixerà en el bloc de notes.

4.1. Transcripció del text en altres aplicacions


Si desitges inserir el text transcrit en una altra aplicació (per exemple, LibreOffice), fes clic dret sobre la icona de Speech Note en la barra del sistema i selecciona l'opció corresponent:


Speech11  

Una altra opció alternativa que oferix el menú és la d'enviar el text al portapapers.

4.2. Modes d'escolta


El mode per defecte, en instal·lar l'aplicació, és el de "Una frase": escolta fins que es produïx una pausa en el dictat, però això pot canviar-se en la configuració del programa, seleccionant la pestanya "Veu a text" i triant el mode d'escolta:
Speech12  

Speech Note oferix tres modes d'escolta configurables des de la pestanya "Veu a text":

1. "Una frase": Escolta fins que detecta una pausa d'uns 4 segons.
2. "Polsar i mantindre": Transcriu mentres mantens polsat el botó "Escoltar". Este mode només funciona en el bloc de notes.
3. "Sempre encés": Este mode és el més interessant. Manté l'escolta activa fins que la desactives. És ideal per a dictats llargs.

5. Transcripció des d'arxius d'àudio o vídeo. Generació de subtítols


Speech Note permet transcriure àudio des d'arxius en lloc d'utilitzar el micròfon. Per a això, seleccionat l'idioma i model que s'usarà per a la transcripció. Després, accedix al menú Fitxer -> Importar des de fitxer ... , selecciona el fitxer d'àudio o vídeo i començarà la conversió d'àudio a text.  

5.1. Generació de subtítols


Una opció interessant és la de generació de subtítols per a vídeos. Els passos són els següents:

Speech Subtitulos0  
[1] Elige el idioma y modelo que se va a usar para la generación de texto.
[2] Selecciona el formato Subtítulos SRT. De esta forma se añadirán marcas de tiempo.
[3] Selecciona el menú Fichero -> Importar desde fichero ...
Cuando termine verás el contenido de los subtítulos en el bloc de notas:
Speech Subtitulos1  
Para guardar los subtítulos selecciona el menú Fichero -> Exportar a fichero ...
Speech Subtitulos3  
[4] Pulsa el botón de "Seleccionar fichero" y da un nombre al fichero de subtítulos que se va a generar. Una buena opción es darle el mismo nombre que el archivo de vídeo pero con la extensión .srt
[5] Selecciona el formato de los subtítulos. Uno de los más habituales es SRT
[6] Por último, pulsa el botón "Exportar" y se creará el fichero.

Ahora, si abres el fichero de vídeo, y el archivo de subtítulos está en la misma carpeta y con el mismo nombre pero con la extensión .srt, verás los subtítulos:
Speech Subtitulos2  

6. Lectura (texto a voz)

Por defecto, Speech Note no incluye modelos de síntesis de voz. Para habilitar la lectura en voz alta, pulsa en "Idiomas" en la ventana principal y carga el modelo que te interese:
Speech6
Speech13  

Elige el idioma en el que estás interesado y selecciona la pestaña "Texto a Voz":
Speech14  

Verás que hay muchas voces disponibles. Selecciona la que más interese (masculina o femenina) y pulsa "Descargar".

Una vez descargada una voz, selecciona el texto en el bloc de notas y pulsa el botón "Leer". Podrás escuchar el audio correspondiente al texto que hay en la ventana de edición:
Speech15  

Si estás en otra aplicación, selecciona el texto, cópialo con Ctrl + C, y luego accede al menú de Speech Note en la barra del sistema para elegir "Leer del portapapeles":
Speech16  

6.1. Generación de fichero de audio


Si prefieres guardar el texto como un archivo de audio, elige la opción del menú Fichero -> Exportar a fichero ...:
Speech17  
[1] Selecciona la pestaña "Exportar a fichero de audio", [2] pulsa el botón de "Cambiar" para elegir la carpeta y el nombre del fichero que quieres generar, y [3] Elige el formato del archivo de audio de entre los disponibles en el desplegable.

7. Traducción

Antes de traducir, es necesario descargar el modelo de IA para la traducción. Pulsa en el menú "Idiomas":
Speech6  

Selecciona el idioma de origen desde el que hay que traducir:

Speech13  ... y luego la pestaña de "Traductor":
Speech Traductor2  

Descarga el modelo y ya puedes traducir.

En la ventana principal de Speech Note, selecciona "Traductor":
Speech Traductor1  

Verás que hay diversa funcionalidad en esta ventana. El botón más importante es que el hace la traducción:
Speech Traductor3  

También hay botones para "leer" el texto en el idioma seleccionado. Ten en cuenta que para poder leer el texto, es necesario tener descargada la voz correspondiente del idioma seleccionado.

Otra funcionalidad que puede ser interesante es la de "Traducir a medida que se escribe". Fíjate que la funcionalidad y botones son muy parecidos a los de Google Translate, pero con la ventaja de que en Speech Note se hace de forma local, sin conexión a internet y de forma privada.

 

 

Historial

Avanzado
Información Versión
2025-01-18 16:14 alonso_vicbar 3
Ver
2025-01-18 16:04 alonso_vicbar 2
Ver
2025-01-18 15:45 alonso_vicbar 1
Ver

Historial

No hay registros que mostrar
Mastodon E-Mail