Cheque verde
Enlace copiado en el portapapeles

La IA en la música: Aplicaciones y herramientas como MusicBrainz Picard

Acompáñanos en una inmersión profunda en el papel de la IA en la música, desde el análisis de datos de audio hasta la generación de nueva música. Explora su impacto y aplicaciones en la industria musical.

La Inteligencia Artificial (IA) consiste en recrear la inteligencia humana en máquinas. Una parte importante del ser humano es nuestra conexión con las artes, especialmente con la música. La música influye profundamente en nuestra cultura y nuestras emociones. Gracias a los avances de la IA, ahora las máquinas pueden crear música que suene como si hubiera sido compuesta por humanos. La música de IA abre nuevas posibilidades para colaboraciones innovadoras entre humanos e IA y transforma la forma en que experimentamos e interactuamos con la música.

En este artículo, exploraremos cómo se utiliza la IA para crear música. También hablaremos de la conexión entre la IA y las herramientas de etiquetado musical como MusicBrainz Picard y su impacto en los artistas, los productores y la industria del entretenimiento en general.

La IA de sonido y su importancia

La IA puede manejar varios tipos de datos, incluido el sonido. Los datos de sonido, a menudo llamados datos de audio, son una mezcla de frecuencias de onda a diferentes intensidades a lo largo del tiempo. Al igual que las imágenes o los datos de series temporales, los datos de audio pueden transformarse en un formato que los sistemas de IA puedan procesar y analizar. Las ondas sonoras pueden convertirse en datos numéricos que pueden ser analizados por modelos de IA.

Otro método interesante es utilizar las Transformadas de Fourier, que convierten las ondas sonoras en un espectrograma. Un espectrograma es una representación visual que muestra cómo varían las distintas frecuencias del sonido a lo largo del tiempo. Los modelos de IA pueden aplicar técnicas de reconocimiento de imágenes para analizar e interpretar los datos de audio, tratando este espectrograma como una imagen. La IA puede identificar patrones y características dentro del sonido, de forma muy parecida a como lo haría con los datos visuales.

Fig. 1. Un ejemplo de sonido clasificado por la IA.

Utilizar la IA para analizar, manipular y generar datos de audio crea toda una gama de aplicaciones. He aquí algunos ejemplos:

  • Generación y composición de música: Creación de música nueva aprendiendo de composiciones existentes y ayudando a los músicos con melodías, armonías y ritmos.
  • Mejora del audio y reducción del ruido: Mejora de la calidad de audio reduciendo el ruido de fondo para centros de llamadas, audífonos y edición de audio.
  • Resumir podcasts: Generar resúmenes concisos de episodios de podcasts para facilitar el consumo de contenidos.
  • Detección de emociones a partir del habla: Detección de emociones en el habla para la atención al cliente, el control de la salud mental y la investigación de la experiencia del usuario.

Comprender cómo funcionan los generadores de canciones de IA

Los generadores de canciones de IA funcionan analizando y aprendiendo de la música existente, de forma similar a la generación de imágenes. Es importante comprender la diferencia entre utilizar la IA para comprender la música y utilizarla para generarla. Comprender la música implica analizar e identificar patrones, mientras que generar música implica crear nuevas composiciones basadas en esos patrones aprendidos.

Fig. 2. Comparación de la comprensión de la música mediante IA y la generación de música mediante IA.

El proceso de generación de música por IA comienza con la recopilación de un gran conjunto de datos de música que incluye varios géneros y estilos. A continuación, el conjunto de datos se descompone en componentes más pequeños, como notas, acordes y ritmos, que se convierten en datos numéricos que la IA puede procesar.

Hay muchos modelos de IA generativa diferentes que pueden entrenarse para generar música. Por ejemplo, modelos de IA como los Transformadores y los Autocodificadores Variacionales (VAEs) pueden trabajar juntos para generar música. Los VAE pueden comprimir los sonidos de entrada en un espacio latente agrupando piezas musicales similares para captar la diversidad y la riqueza de la música. A continuación, los Transformadores utilizan este espacio latente para generar nueva música comprendiendo patrones y centrándose en las notas importantes de una secuencia.

Una vez entrenado un modelo de IA con estos datos, la IA puede generar música nueva prediciendo la siguiente nota o acorde basándose en lo que ha aprendido. Puede crear composiciones enteras encadenando estas predicciones. La música generada puede afinarse para ajustarse a estilos o preferencias específicos.

Estamos empezando a ver más generadores de música que utilizan esta tecnología. Aquí tienes algunos ejemplos:

  • MusicLM de Google: Genera música a partir de mensajes de texto, permitiendo a los usuarios especificar el género, el estado de ánimo, los instrumentos y la sensación general.
  • MusicGen de Meta: Crea música a partir de descripciones de texto o melodías existentes, utilizando una herramienta llamada EnCodec para procesar datos de audio.
  • Audio Estable 2.0 de Stability AI: Produce pistas de audio y efectos de sonido de alta calidad a partir de entradas de texto y audio, capaz de crear pistas completas y transformar muestras de audio basándose en indicaciones.

El impacto de la IA en la industria musical

La innovación de la IA está creando nuevas oportunidades y retos para músicos, oyentes y productores, que les llevan a situaciones que quizá no hayan experimentado antes. Es interesante ver cómo cada grupo se está adaptando a estos avances, utilizando nuevas herramientas y sorteando las preocupaciones sobre la originalidad y la ética. Además de generar música, la IA tiene otras posibilidades interesantes en la industria musical, como mejorar las actuaciones en directo, mejorar el descubrimiento de música y ayudar en los procesos de producción. Veamos más de cerca cómo está afectando la IA a los músicos, oyentes y productores de la industria musical.

Figura 3. El impacto de la IA Generativa en la industria musical.

Impacto en los músicos

La IA está cambiando la forma en que los músicos crean música. Las herramientas integradas con IA generativa pueden ayudar a generar nuevas melodías, progresiones de acordes y letras, facilitando a los músicos superar los bloqueos creativos. La IA también se ha utilizado para completar obras inacabadas, como la nueva canción de los Beatles"Now And Then", creada con la voz de John Lennon a partir de una vieja maqueta. Sin embargo, el auge de la música generada por IA que imita el estilo de artistas consagrados suscita dudas sobre la originalidad. Por ejemplo, a artistas como Bad Bunny les preocupa que la IA replique sus voces y estilos sin consentimiento.

Además de crear música, la IA y la visión por ordenador pueden ayudar a los músicos a montar mejores actuaciones y vídeos musicales. Un vídeo musical consta de muchos elementos diferentes, y uno de ellos es el baile. Los modelos de estimación de poses como Ultralytics YOLOv8 pueden comprender las poses humanas en imágenes y vídeos y desempeñar un papel en la creación de secuencias de baile coreografiadas y sincronizadas con la música.

Otro buen ejemplo de cómo puede utilizarse la IA para la coreografía es el proyecto"Dance to Music" de NVIDIA. En este proyecto, utilizaron la IA y un proceso de dos pasos para generar nuevos movimientos de baile que fueran diversos, coherentes con el estilo y acordes con el ritmo. En primer lugar, se utilizó la estimación de la pose y un detector cinemático del ritmo para aprender varios movimientos de baile al compás a partir de una gran colección de vídeos de baile. Después, se utilizó un modelo generativo de IA para organizar estos movimientos de baile en una coreografía que coincidiera con el ritmo y el estilo de la música. Los movimientos de baile coreografiados por la IA añaden un elemento visual interesante a los vídeos musicales y ayudan a los artistas a ser más creativos.

Impacto en los oyentes

Para los oyentes, la IA puede mejorar la experiencia de descubrir y escuchar música. Plataformas como Spotify y Apple Music utilizan la IA para crear listas de reproducción personalizadas y recomendar nueva música basándose en los hábitos de escucha de los usuarios. Descubrir nuevos artistas y géneros en estas plataformas es la magia de la IA. 

La realidad virtual (RV) potenciada por la IA también está mejorando las experiencias de los conciertos en directo. Por ejemplo, Travis Scott utiliza la RV para crear actuaciones virtuales que llegan a audiencias globales. Sin embargo, la abundancia de música generada por IA en plataformas como TikTok puede hacer que el descubrimiento musical resulte abrumador. Puede dificultar que los nuevos artistas destaquen.

Fig. 4. La IA hace posibles las experiencias de conciertos en realidad virtual (RV).

Impacto en los productores

Los productores se benefician de la IA de varias maneras. Las herramientas de IA que ayudan a corregir el tono, mezclar y masterizar agilizan el proceso de producción. Los instrumentos y sintetizadores virtuales con IA, como el Watson Beat de IBM, pueden crear nuevos sonidos y texturas que amplían las posibilidades creativas. 

La IA en las plataformas de streaming no es sólo un beneficio para los oyentes; también ayuda a los productores al crear un público más amplio. Sin embargo, al igual que preocupa a los músicos, la capacidad de la IA para imitar el estilo de artistas consagrados plantea cuestiones éticas y legales sobre la explotación de las voces y estilos únicos de los artistas. Esto ha dado lugar a disputas legales, como las demandas de grandes empresas musicales como Universal, Sony y Warner contra startups de IA como Suno y Udio por utilizar supuestamente obras protegidas por derechos de autor para entrenar sus modelos sin permiso.

Gestión de bibliotecas musicales con herramientas integradas en IA como MusicBrainz Picard

Hemos explorado brevemente algunas aplicaciones de la IA en la música comprendiendo su impacto en las distintas partes interesadas de la industria musical. Ahora, vamos a comprender una aplicación más específica de la IA en la música: Las herramientas de gestión musical mejoradas con IA, como MusicBrainz Picard. Estas herramientas son increíblemente útiles para organizar y gestionar bibliotecas de música digital. 

Fig. 5. Las bibliotecas musicales pueden gestionarse mediante IA.

Identifican y etiquetan automáticamente los archivos de música con metadatos precisos, como nombres de artistas, títulos de álbumes y números de pista. MusicBrainz Picard facilita mantener bien organizadas las colecciones de música. Una de las tecnologías clave integradas en MusicBrainz Picard son las huellas digitales de audio AcoustID. Estas huellas identifican los archivos de música basándose en su contenido de audio real, aunque los archivos carezcan de metadatos.

¿Por qué es tan importante? Grandes organizaciones como la BBC, Google, Amazon, Spotify y Pandora confían en los datos de MusicBrainz para mejorar sus servicios relacionados con la música. Los metadatos creados por herramientas como MusicBrainz Picard son cruciales para los desarrolladores que crean bases de datos musicales, aplicaciones de etiquetado u otro software relacionado con la música. La columna vertebral de la IA son los datos, y sin herramientas como Picard sería muy difícil disponer de los datos limpios y precisos necesarios para el análisis y el desarrollo de aplicaciones. Es fascinante que las herramientas mejoradas de IA utilicen la IA y ayuden a crear los datos necesarios para las aplicaciones de IA, formando un ciclo beneficioso de mejora e innovación.

Notas finales sobre la IA en la música

Ya hemos hablado de las olas que está provocando la IA en la música. El panorama legal que rodea a la música generada por IA también está evolucionando. Las normativas actuales, como las de la Oficina de Derechos de Autor de EE.UU., estipulan que las obras generadas totalmente por IA no pueden ser objeto de derechos de autor, ya que carecen de autoría humana. Sin embargo, si un humano contribuye significativamente al proceso creativo, la obra puede optar a la protección de los derechos de autor. A medida que la IA siga integrándose en la industria musical, los debates legales y éticos en curso serán vitales para sortear estos retos. De cara al futuro, la IA tiene un enorme potencial en la música, al combinar la tecnología con la creatividad humana para ampliar las posibilidades de creación y producción musical.

Explora la IA visitando nuestro repositorio de GitHub y uniéndote a nuestra vibrante comunidad. Infórmate sobre las aplicaciones de la IA en la fabricación y la agricultura en nuestras páginas de soluciones.

Logotipo de FacebookLogotipo de TwitterLogotipo de LinkedInSímbolo de enlace de copia

Leer más en esta categoría

¡Construyamos juntos el futuro
de la IA!

Comienza tu viaje con el futuro del aprendizaje automático