Wiki LliureX | Audacity

¿Qué es Audacity?

Audacity es un software libre y de código abierto diseñado para la grabación y edición de audio. Es una de las herramientas más populares en el ámbito educativo, musical y multimedia debido a su facilidad de uso, su versatilidad y su compatibilidad con múltiples sistemas operativos, incluido LliureX (Ubuntu). Permite grabar sonidos, editarlos, aplicar efectos y exportarlos en distintos formatos de audio como WAV, MP3, OGG, entre otros.

LliureX incluye una versión de Audacity que incorpora un plugin de inteligencia artificial OpenVINO que ofrece funcionalidad de generación de música, transcripción de audio a texto, filtro de supresión de ruido y separador de pistas de audio.

Configuración

Antes de utilizar Audacity es necesario tener en cuenta dos parámetros importantes: el dispositivo de entrada que se va a utilizar para realizar una grabación, si es el caso, (el micro, por ejemplo) y el dispositivo de salida del audio. Pueden configurarse los parámetros más importantes pulsando el botón de Audio Steup o en el menú: Editar / Preferencias.

Seleccionando la opción de Audio Settings podemos editar algunos parámetros más, como la frecuencia de muestreo (Project Sample Rate). A mayor frecuencia, mayor calidad del sonido. Un valor razonable para una buena calidad sin que el tamaño del fichero resultante sea excesivo es 44100 Hz.

El formato de la muestra "coma flotante 32 bits" indica el tamaño de los datos de sonido almacenados. 32 bits es el tamaño mayor, y proporciona una mayor calidad, aunque se pueden elegir valores menores como 24 o 16 bits.

Funcionamiento

Grabación de audio

Audacity permite grabar desde un micrófono, una entrada de línea u otras fuentes de sonido conectadas al sistema. También es posible grabar el audio que se reproduce en el propio ordenador.

Para iniciar una grabación basta con pulsar el botón rojo de la barra de herramientas [1]. Y para detenerla, el botón con el cuadrado [2]:

Aparecerán dos pistas (si se está grabando en estéreo) con las frecuencias de la muestra.

Importación y exportación

Se pueden abrir archivos de sonido existentes en diversos formatos de audio desde el menú fichero / abrir. Si lo que se desea es añadir el fichero al proyecto existente sin que se sustituya el contenido, para que aparezca como una pista más, selecciona fichero / importar.

Una vez editado el audio, se puede exportar en formatos como MP3, WAV, FLAC o AIFF.

Para guardar un proyecto en formato de Audacity, selecciona fichero / guardar el proyecto. Se creará un fichero con la extensión .aup3, que es la propia de Audacity. Esta almacena información de todas las pistas y parámetros de configuración.

La exportación a formatos reproducibles por otras aplicaciones se realiza desde el menú fichero / exportar el audio:

Aquí se pueden seleccionar parámetros como la frecuencia de muestreo o el formato de la codificación, así como si se va a exportar el proyecto completo o solo el rango seleccionado.

Edición de audio

Audacity es, principalmente, un editor de audio. Algunas de las funciones más importantes que permite realizar son las siguiente:

Recortar, copiar, pegar y eliminar fragmentos de audio.
Dividir pistas, moverlas y unirlas.
Ajustar el volumen o aplicar fundidos de entrada/salida.
Utilizar múltiples pistas para mezclar sonidos.

La zona de edición es la que se muestra con las pistas del proyecto:

La herramienta de selección se activa con el botón de la barra de herramientas [1].

Si necesitas ampliar o reducir el zoom sobre la pista puedes utilizar los botones de las lupas en la barra de herramientas, aunque resulta más cómodo pulsar la tecla Ctrl + la rueda del ratón.

Para seleccionar un fragmento de la pista, pulsa con el puntero del ratón en el inicio de la selección y arrastra el puntero hasta el final del fragmento. El fondo del fragmento seleccionado aparecerá en color azul claro.

Los efectos aplicados desde Audacity se aplicarán a la selección. Si no hubiera ninguna selección, se aplicarán sobre toda la pista.

Edición de volumen

Si lo que queremos es subir o bajar el volumen de una pista, podemos hacerlo directamente desde la barra de desplazamiento que hay a la izquierda de la pista con los símbolos + y -. Si el objetivo es modificar el volumen del fragmento, seleccionamos el menú Efecto / Volumen y compresión / Amplifica ... Con la barra de desplazamiento podemos aumentar o disminuir el volumen:

Puede verse en la imagen cómo la amplitud de la frecuencia en el fragmento seleccionado ha sido reducida:

Para tener un control mayor sobre el volumen de diversos fragmentos es más versátil la herramienta envoltura [1]:

A continuación marca puntos de control [2] y [3]. Estos puntos pueden arrastrarse para ampliar o disminuir el volumen gradualmente. También se puede arrastrar entre los puntos de control para obtener una curva.

Otra función interesante es la de silenciar un fragmento de una pista. Para ello basta con seleccionar el rango y pulsar el botón [1]:

Clips de audio

Los clips de audio son fragmentos que pueden moverse a lo largo de la línea del tiempo y ser tratados independientemente. Para crear un clip a partir de una pista, selecciona la herramienta de selección [1], marca el fragmento pinchando y arrastrando en la zona de edición [2] y pulsa el botón derecho del ratón para mostrar el menú contextual, o selecciona el menú Editar / Audio clips / Dividir (o Unir, si se están fusionando clips de audio):

Aplicación de efectos

Audacity incluye una amplia variedad de efectos integrados en el menú Efectos, como eco, reverberación, cambio de tono o velocidad, normalización, compresión o eliminación de ruido, entre otros.

En el manual de Audacity tienes una lista de todos los efectos que se pueden aplicar. Desde el menú Efectos se pueden instalar más mediante el gestor de plugins.

OpenVINO. La IA en Audacity

LliureX empaqueta una versión de Audacity que integra el plugin de Inteligencia artificial OpenVINO de Intel. La funcionalidad añadida por el plugin incluye: generación de música, separación de pistas (por ejemplo: voz / música), reducción de ruido, y transcripción de la voz a texto para la generación de una pista de texto.

Generación de música por IA

OpenVINO es capaz de generar música a partir de un texto (prompt). Esta funcionalidad se encuentra disponible a través del menú: Generar / OpenVINO Music Generation ...:

[1] Selecciona la duración de la música generada.

[2] Elige el modelo: mono o estéreo, y la calidad: 16 o 8 bits.

[3] En el prompt indicamos las instrucciones para que la música generada se ajuste a nuestras preferencias. Es importante describirlo en detalle para que el resultado sea el deseado. Pero hay que tener en cuenta que los modelos han sido entrenados en inglés, por lo que funcionarán mucho mejor si lo escribimos en este idioma.

[4] Selecciona el tipo de hardware: GPU si dispones de tarjeta gráfica avanzada con GPU (Graphical Process Unit) para que el proceso sea más rápido, o CPU en otro caso.

[5] Semilla (seed). Si se deja en blanco, cada vez que se genere música, ésta será diferente porque se creará una semilla de generación de números aleatorios también aleatoria. Si queremos que se genere siempre la misma música, introduciremos aquí un número. Cada vez que usemos ese mismo número, con el mismo prompt, se generará la misma música.

[6] Longitud del contexto: es el número de segundos anteriores, de la pista actual, que se tendrán en cuenta para que la generación sea una continuación lo más fiel posible a la música anterior.

[7] Activa este interruptor para que se tenga en cuenta el contexto anterior.

La generación puede tardar unos minutos:

Separación de pistas

OpenVINO permite separar pistas de audio con los diferentes instrumentos, incluida la voz. Esta opción se encuentra en el menú: Efecto / Efectos IA OpenVINO ... / Separación de música OpenVINO:

En el desplegable de modo de separación se puede elegir entre 2 o 4 pistas. En la opción de 2 pistas se extrae la voz en una de ellas y los instrumentos en la otra. Tras el proceso, se generarán las pistas:

Puedes probar a silenciar la pista original pulsando el botón "silencio" en el panel de la izquierda. A continuación, silencia también la pista de la voz , o la de los instrumentos, para ver que realmente se han separado las pistas correctamente:

Eliminación de ruido

Una opción interesante para eliminar el ruido típico producido por un micrófono de poca calidad o la grabación en un entorno ruidoso es la de aplicar un filtro basado en IA como el de OpenVINO. Selecciona la opción del menú: Efecto / Efectos IA OpenVINO / OpenVINO Supresión de ruido:

Existen 3 modelos distintos de supresión de ruido que se pueden seleccionar en el desplegable.

Transcripción de voz a texto

Otra de las funciones que aporta OpenVINO es la de generación de etiquetas de texto a partir del audio. Esta opción se encuentra disponible en el menú: Analizar / OpenVINO transcripción Whisper:

[1] Selecciona el modelo a utilizar para la transcripción

[2] En el idioma fuente puedes dejar "Auto" para que lo detecte automáticamente, pero si quieres asegurarte, selecciónalo del desplegable.

Tras el proceso se generar una pista con las etiquetas de texto:

Super resolución de audio

OpenVINO incluye un filtro para mejorar la calidad del audio desde el menú: Efecto / Efectos IA OpenVINO / OpenVINO super resolución:

Más información sobre la funcionalidad de OpenVINO aquí en inglés.

Translations

Estructuras

Audacity