Speech Note és una aplicació molt completa que permet prendre, llegir i traduir notes en diversos idiomes. Per a això, oferix funcions de conversió de veu a text, text a veu i traducció automàtica. Tot el processament de text i veu es realitza de manera local, sense connexió a Internet, garantint així la privacitat de l'usuari. Cap dada s'envia a internet.
La instal·lació de Speech Note és senzilla i es realitza a través del Centre de Control de LliureX. Per a això, seguix estos passos:
1. Obri el Centre de Control de LliureX des del menú:
Aplicacions -> Administració LliureX -> Zero Center (la imatge pot variar en funció de la versió de *LliureX o de la personalització aplicada per l'usuari)
2. En la barra de busca de Zero Center, escriu "speech" i selecciona Speech Note.
3. Seguix les instruccions d'instal·lació.
Una vegada instal·lada, l'aplicació apareixerà en la categoria d'Utilitats dins del menú de LliureX.
En obrir Speech Note, es mostrarà una finestra amb un bloc de notes on podràs escriure o transcriure text mitjançant dictat per veu:
Speech Note compta amb diverses opcions de configuració per a personalitzar el seu ús.
Per a accedir ràpidament a les funcions principals de Speech Note des de la icona en la barra del sistema:
1. Obri Speech Note i accedix al menú principal (primer botó de la barra de menú superior):
2. Selecciona la pestanya "Interfície d'usuari".
3. Activa l'opció "Usar icona en la barra del sistema":
S'agregarà una icona d'accés a l'aplicació en la barra del sistema, que romandrà ací encara que es tanque la finestra de Speech Note:
La instal·lació per defecte de LliureX inclou dos models d'intel·ligència artificial de reconeixement de veu: FasterWhisper Small en castellà i FasterWhisper Small en valencià. En ser models xicotets i bastant eficients no necessiten de molta potència de càlcul i tenen una velocitat raonable en equips amb característiques maquinari modestes. No obstant això, es poden instal·lar altres models i altres idiomes. Per a això, polsa sobre "Idiomes" en el menú superior:
En la part inferior del bloc de notes es pot seleccionar el model (i idioma) que s'utilitzarà per a la transcripció de veu a text [1], i del model que s'usarà per a la lectura mitjançant conversió de text a veu [2]. Es poden descarregar models addicionals de text a veu, de veu a text o de traducció en el menú [3]:
Speech Note pot usar-se tant en mode finestra, amb el bloc de notes inclòs, com des de la icona de la barra del sistema, que oferix una versió més compacta i ràpida per a transcriure o llegir textos sense obrir la finestra principal.
La manera d'accedir al mode compacte és fent clic amb el botó dret del ratolí sobre la icona de la barra del sistema. Esta segona opció, encara que inclou menys funcionalitat, pot ser més còmoda per a transcriure o llegir textos des d'altres aplicacions en lloc del bloc de notes de Speech Note. Este és l'aspecte que té al menú en polsar sobre la icona de l'aplicació en la barra del sistema:
Per a transcriure d'àudio a text en el bloc de notes n'hi ha prou amb seleccionar el model (idioma) en la part inferior de la finestra i polsar el botó de "Escoltar":
El text apareixerà en el bloc de notes.
Si desitges inserir el text transcrit en una altra aplicació (per exemple, LibreOffice), fes clic dret sobre la icona de Speech Note en la barra del sistema i selecciona l'opció corresponent:
Una altra opció alternativa que oferix el menú és la d'enviar el text al portapapers.
El mode per defecte, en instal·lar l'aplicació, és el de "Una frase": escolta fins que es produïx una pausa en el dictat, però això pot canviar-se en la configuració del programa, seleccionant la pestanya "Veu a text" i triant el mode d'escolta:
Speech Note oferix tres modes d'escolta configurables des de la pestanya "Veu a text":
1. "Una frase": Escolta fins que detecta una pausa d'uns 4 segons.
2. "Polsar i mantindre": Transcriu mentres mantens polsat el botó "Escoltar". Este mode només funciona en el bloc de notes.
3. "Sempre encés": Este mode és el més interessant. Manté l'escolta activa fins que la desactives. És ideal per a dictats llargs.
Speech Note permet transcriure àudio des d'arxius en lloc d'utilitzar el micròfon. Per a això, seleccionat l'idioma i model que s'usarà per a la transcripció. Després, accedix al menú Fitxer -> Importar des de fitxer ... , selecciona el fitxer d'àudio o vídeo i començarà la conversió d'àudio a text.
Una opció interessant és la de generació de subtítols per a vídeos. Els passos són els següents:
[1] Elige el idioma y modelo que se va a usar para la generación de texto.
[2] Selecciona el formato Subtítulos SRT. De esta forma se añadirán marcas de tiempo.
[3] Selecciona el menú Fichero -> Importar desde fichero ...
Cuando termine verás el contenido de los subtítulos en el bloc de notas:
Para guardar los subtítulos selecciona el menú Fichero -> Exportar a fichero ...
[4] Pulsa el botón de "Seleccionar fichero" y da un nombre al fichero de subtítulos que se va a generar. Una buena opción es darle el mismo nombre que el archivo de vídeo pero con la extensión .srt
[5] Selecciona el formato de los subtítulos. Uno de los más habituales es SRT
[6] Por último, pulsa el botón "Exportar" y se creará el fichero.
Ahora, si abres el fichero de vídeo, y el archivo de subtítulos está en la misma carpeta y con el mismo nombre pero con la extensión .srt, verás los subtítulos:
Por defecto, Speech Note no incluye modelos de síntesis de voz. Para habilitar la lectura en voz alta, pulsa en "Idiomas" en la ventana principal y carga el modelo que te interese:
Elige el idioma en el que estás interesado y selecciona la pestaña "Texto a Voz":
Verás que hay muchas voces disponibles. Selecciona la que más interese (masculina o femenina) y pulsa "Descargar".
Una vez descargada una voz, selecciona el texto en el bloc de notas y pulsa el botón "Leer". Podrás escuchar el audio correspondiente al texto que hay en la ventana de edición:
Si estás en otra aplicación, selecciona el texto, cópialo con Ctrl + C, y luego accede al menú de Speech Note en la barra del sistema para elegir "Leer del portapapeles":
Si prefieres guardar el texto como un archivo de audio, elige la opción del menú Fichero -> Exportar a fichero ...:
[1] Selecciona la pestaña "Exportar a fichero de audio", [2] pulsa el botón de "Cambiar" para elegir la carpeta y el nombre del fichero que quieres generar, y [3] Elige el formato del archivo de audio de entre los disponibles en el desplegable.
Antes de traducir, es necesario descargar el modelo de IA para la traducción. Pulsa en el menú "Idiomas":
Selecciona el idioma de origen desde el que hay que traducir:
... y luego la pestaña de "Traductor":
Descarga el modelo y ya puedes traducir.
En la ventana principal de Speech Note, selecciona "Traductor":
Verás que hay diversa funcionalidad en esta ventana. El botón más importante es que el hace la traducción:
También hay botones para "leer" el texto en el idioma seleccionado. Ten en cuenta que para poder leer el texto, es necesario tener descargada la voz correspondiente del idioma seleccionado.
Otra funcionalidad que puede ser interesante es la de "Traducir a medida que se escribe". Fíjate que la funcionalidad y botones son muy parecidos a los de Google Translate, pero con la ventaja de que en Speech Note se hace de forma local, sin conexión a internet y de forma privada.