Speech Note és una aplicació molt completa que permet prendre, llegir i traduir notes en diversos idiomes. Per a això, oferix funcions de conversió de veu a text, text a veu i traducció automàtica. Tot el processament de text i veu es realitza de manera local, sense connexió a Internet, garantint així la privacitat de l'usuari. Cap dada s'envia a internet.
La instal·lació de Speech Note és senzilla i es realitza a través del Centre de Control de LliureX. Per a això, seguix estos passos:
1. Obri el Centre de Control de LliureX des del menú:
Aplicacions -> Administració LliureX -> Zero Center (la imatge pot variar en funció de la versió de *LliureX o de la personalització aplicada per l'usuari)
2. En la barra de busca de Zero Center, escriu "speech" i selecciona Speech Note.
3. Seguix les instruccions d'instal·lació.
Una vegada instal·lada, l'aplicació apareixerà en la categoria d'Utilitats dins del menú de LliureX.
En obrir Speech Note, es mostrarà una finestra amb un bloc de notes on podràs escriure o transcriure text mitjançant dictat per veu:
Speech Note compta amb diverses opcions de configuració per a personalitzar el seu ús.
Per a accedir ràpidament a les funcions principals de Speech Note des de la icona en la barra del sistema:
1. Obri Speech Note i accedix al menú principal (primer botó de la barra de menú superior):
2. Selecciona la pestanya "Interfície d'usuari".
3. Activa l'opció "Usar icona en la barra del sistema":
S'agregarà una icona d'accés a l'aplicació en la barra del sistema, que romandrà ací encara que es tanque la finestra de Speech Note:
La instal·lació per defecte de LliureX inclou dos models d'intel·ligència artificial de reconeixement de veu: FasterWhisper Small en castellà i FasterWhisper Small en valencià. En ser models xicotets i bastant eficients no necessiten de molta potència de càlcul i tenen una velocitat raonable en equips amb característiques maquinari modestes. No obstant això, es poden instal·lar altres models i altres idiomes. Per a això, polsa sobre "Idiomes" en el menú superior:
En la part inferior del bloc de notes es pot seleccionar el model (i idioma) que s'utilitzarà per a la transcripció de veu a text [1], i del model que s'usarà per a la lectura mitjançant conversió de text a veu [2]. Es poden descarregar models addicionals de text a veu, de veu a text o de traducció en el menú [3]:
Speech Note pot usar-se tant en mode finestra, amb el bloc de notes inclòs, com des de la icona de la barra del sistema, que oferix una versió més compacta i ràpida per a transcriure o llegir textos sense obrir la finestra principal.
La manera d'accedir al mode compacte és fent clic amb el botó dret del ratolí sobre la icona de la barra del sistema. Esta segona opció, encara que inclou menys funcionalitat, pot ser més còmoda per a transcriure o llegir textos des d'altres aplicacions en lloc del bloc de notes de Speech Note. Este és l'aspecte que té al menú en polsar sobre la icona de l'aplicació en la barra del sistema:
Per a transcriure d'àudio a text en el bloc de notes n'hi ha prou amb seleccionar el model (idioma) en la part inferior de la finestra i polsar el botó de "Escoltar":
El text apareixerà en el bloc de notes.
Si desitges inserir el text transcrit en una altra aplicació (per exemple, LibreOffice), fes clic dret sobre la icona de Speech Note en la barra del sistema i selecciona l'opció corresponent:
Una altra opció alternativa que oferix el menú és la d'enviar el text al portapapers.
El mode per defecte, en instal·lar l'aplicació, és el de "Una frase": escolta fins que es produïx una pausa en el dictat, però això pot canviar-se en la configuració del programa, seleccionant la pestanya "Veu a text" i triant el mode d'escolta:
Speech Note oferix tres modes d'escolta configurables des de la pestanya "Veu a text":
1. "Una frase": Escolta fins que detecta una pausa d'uns 4 segons.
2. "Polsar i mantindre": Transcriu mentres mantens polsat el botó "Escoltar". Este mode només funciona en el bloc de notes.
3. "Sempre encés": Este mode és el més interessant. Manté l'escolta activa fins que la desactives. És ideal per a dictats llargs.
Speech Note permet transcriure àudio des d'arxius en lloc d'utilitzar el micròfon. Per a això, seleccionat l'idioma i model que s'usarà per a la transcripció. Després, accedix al menú Fitxer -> Importar des de fitxer ... , selecciona el fitxer d'àudio o vídeo i començarà la conversió d'àudio a text.
Una opció interessant és la de generació de subtítols per a vídeos. Els passos són els següents:
[1] Tria l'idioma i model que s'usarà per a la generació de text.
[2] Selecciona el format Subtítols SRT. D'esta manera s'afegiran marques de temps.
[3] Selecciona el menú Fitxer -> Importar des de fitxer ...
Quan acabe veuràs el contingut dels subtítols en el bloc de notes:
Per a guardar els subtítols selecciona el menú Fitxer -> Exportar a fitxer ...
[4] Polsa el botó de "Seleccionar fitxer" i dona un nom al fitxer de subtítols que es generarà. Una bona opció és donar-li el mateix nom que l'arxiu de vídeo però amb l'extensió .srt
[5] Selecciona el format dels subtítols. Un dels més habituals és SRT
[6] Finalment, polsa el botó "Exportar" i es crearà el fitxer.
Ara, si obris el fitxer de vídeo, i l'arxiu de subtítols està en la mateixa carpeta i amb el mateix nom però amb l'extensió .srt, veuràs els subtítols:
Per defecte, Speech Note no inclou models de síntesis de veu. Per a habilitar la lectura en veu alta, polsa en "Idiomes" en la finestra principal i càrrega el model que t'interesse:
Tria l'idioma en el qual estàs interessat i selecciona la pestanya "Text a Veu":
Veuràs que hi ha moltes veus disponibles. Selecciona la que més interesse (masculina o femenina) i polsa "Descarregar".
Una vegada descarregada una veu, selecciona el text en el bloc de notes i polsa el botó "Llegir". Podràs escoltar l'àudio corresponent al text que hi ha en la finestra d'edició:
Si estàs en una altra aplicació, selecciona el text, copia'l amb Ctrl + C, i després accedix al menú de Speech Note en la barra del sistema per a triar "Llegir del portapapers":
Si preferixes guardar el text com un arxiu d'àudio, tria l'opció del menú Fitxer -> Exportar a fitxer ...:
[1] Selecciona la pestanya "Exportar a fitxer d'àudio", [2] polsa el botó de "Canviar" per a triar la carpeta i el nom del fitxer que vols generar, i [3] Tria el format de l'arxiu d'àudio d'entre els disponibles en el desplegable.
Abans de traduir, és necessari descarregar el model de IA per a la traducció. Polsa en el menú "Idiomes":
Selecciona l'idioma d'origen des del qual cal traduir:
... i després la pestanya de "Traductor":
Descàrrega el model i ja pots traduir.
En la finestra principal de Speech Note, selecciona "Traductor":
Veuràs que hi ha diversa funcionalitat en esta finestra. El botó més important és que el fa la traducció:
També hi ha botons per a "llegir" el text en l'idioma seleccionat. Tingues en compte que per a poder llegir el text, és necessari tindre descarregada la veu corresponent de l'idioma seleccionat.
Una altra funcionalitat que pot ser interessant és la de "Traduir a mesura que s'escriu". Fixa't que la funcionalitat i botons són molt semblants als de Google Translate, però amb l'avantatge que en Speech Note es fa de manera local, sense connexió a internet i de manera privada.