Verificação verde
Link copiado para a área de transferência

IA na música: Aplicações e ferramentas como o MusicBrainz Picard

Junta-te a nós para um mergulho profundo no papel da IA na música, desde a análise de dados de áudio até à criação de nova música. Explora o seu impacto e aplicações na indústria musical.

A Inteligência Artificial (IA) consiste em recriar a inteligência humana nas máquinas. Uma parte importante do ser humano é a nossa ligação às artes, especialmente à música. A música influencia profundamente a nossa cultura e as nossas emoções. Graças aos avanços da IA, as máquinas podem agora criar música que soa como se tivesse sido composta por humanos. A música com IA abre novas possibilidades para colaborações inovadoras entre humanos e IA e transforma a forma como vivemos e interagimos com a música.

Neste artigo, vamos explorar a forma como a IA é utilizada para criar música. Discutiremos também a ligação entre a IA e as ferramentas de marcação de música, como o MusicBrainz Picard, e o seu impacto nos artistas, produtores e na indústria do entretenimento em geral.

A IA do som e o seu significado

A IA pode tratar vários tipos de dados, incluindo o som. Os dados de som, frequentemente designados por dados de áudio, são uma mistura de frequências de onda com diferentes intensidades ao longo do tempo. Tal como as imagens ou os dados de séries temporais, os dados de áudio podem ser transformados num formato que os sistemas de IA podem processar e analisar. As ondas sonoras podem ser convertidas em dados numéricos que podem ser analisados por modelos de IA.

Outro método interessante é utilizar as Transformadas de Fourier, que convertem as ondas sonoras num espetrograma. Um espetrograma é uma representação visual que mostra como as diferentes frequências do som variam ao longo do tempo. Os modelos de IA podem aplicar técnicas de reconhecimento de imagem para analisar e interpretar os dados de áudio, tratando este espetrograma como uma imagem. A IA pode identificar padrões e características no som, tal como faria com dados visuais.

Fig. 1. Um exemplo de som classificado pela IA.

A utilização da IA para analisar, manipular e gerar dados de áudio cria uma série de aplicações. Eis alguns exemplos:

  • Criação e composição de música: Cria novas músicas aprendendo com as composições existentes e ajudando os músicos com melodias, harmonias e ritmos.
  • Melhoria de áudio e redução de ruído: Melhora a qualidade do áudio reduzindo o ruído de fundo para call centers, aparelhos auditivos e edição de áudio.
  • Resumir podcasts: Gera resumos concisos de episódios de podcast para facilitar o consumo de conteúdos.
  • Deteção de emoções a partir do discurso: Detetar emoções no discurso para o serviço ao cliente, monitorização da saúde mental e investigação da experiência do utilizador.

Compreender como funcionam os geradores de canções com IA

Os geradores de canções com IA funcionam analisando e aprendendo com a música existente, à semelhança da geração de imagens. É importante compreender a diferença entre utilizar a IA para compreender a música e utilizar a IA para a gerar. Compreender a música implica analisar e identificar padrões, enquanto gerar música implica criar novas composições com base nesses padrões aprendidos.

Figura 2. Compara a compreensão da música utilizando a IA e a geração de música com IA.

O processo de geração de música da IA começa com a recolha de um grande conjunto de dados de música que inclui vários géneros e estilos. O conjunto de dados é depois dividido em componentes mais pequenos, como notas, acordes e ritmos, que são convertidos em dados numéricos que a IA pode processar.

Existem muitos modelos de IA generativa diferentes que podem ser treinados para gerar música. Por exemplo, modelos de IA como Transformers e Variational Autoencoders (VAEs) podem trabalhar em conjunto para gerar música. Os VAEs podem comprimir os sons de entrada num espaço latente, agrupando peças musicais semelhantes para captar a diversidade e a riqueza da música. Os transformadores utilizam então este espaço latente para gerar nova música, compreendendo padrões e concentrando-se em notas importantes numa sequência.

Quando um modelo de IA é treinado com estes dados, a IA pode gerar nova música prevendo a próxima nota ou acorde com base no que aprendeu. Pode criar composições inteiras juntando estas previsões. A música gerada pode ser ajustada para corresponder a estilos ou preferências específicos.

Começamos a ver mais geradores de música a utilizar esta tecnologia. Aqui tens alguns exemplos:

  • MusicLM by Google: Gera música com base em instruções de texto, permitindo aos utilizadores especificar o género, o estado de espírito, os instrumentos e a sensação geral.
  • MusicGen da Meta: Cria música a partir de descrições de texto ou melodias existentes, utilizando uma ferramenta chamada EnCodec para processar dados de áudio.
  • Stable Audio 2.0 por Stability AI: Produz faixas de áudio de alta qualidade e efeitos sonoros a partir de texto e entradas de áudio, capaz de criar faixas completas e transformar amostras de áudio com base em avisos.

O impacto da IA na indústria musical

A inovação da IA está a criar novas oportunidades e desafios para músicos, ouvintes e produtores, conduzindo a situações que talvez nunca tenham vivido antes. É interessante ver como cada grupo se está a adaptar a estes avanços, utilizando novas ferramentas e lidando com preocupações sobre originalidade e ética. Para além de gerar música, a IA tem outras potencialidades interessantes na indústria musical, como melhorar as actuações ao vivo, melhorar a descoberta de música e ajudar nos processos de produção. Vejamos mais de perto como a IA está a afetar músicos, ouvintes e produtores na indústria musical.

Figura 3. O impacto da IA generativa na indústria musical.

Impacto nos músicos

A IA está a mudar a forma como os músicos criam música. As ferramentas integradas com IA generativa podem ajudar a gerar novas melodias, progressões de acordes e letras, facilitando aos músicos a superação de bloqueios criativos. A IA também tem sido utilizada para completar trabalhos inacabados, como a nova canção dos Beatles"Now And Then", criada com as vozes de John Lennon a partir de uma antiga demo. No entanto, o aumento da música gerada por IA que imita o estilo de artistas estabelecidos levanta preocupações sobre a originalidade. Por exemplo, artistas como Bad Bunny estão preocupados com o facto de a IA replicar as suas vozes e estilos sem consentimento.

Para além da criação de música, a IA e a visão por computador podem ajudar os músicos a criar melhores actuações e vídeos musicais. Um vídeo musical é composto por muitos elementos diferentes e um desses elementos é a dança. Modelos de estimativa de pose como o Ultralytics YOLOv8 podem compreender as poses humanas em imagens e vídeos e desempenham um papel importante na criação de sequências de dança coreografadas que são sincronizadas com a música.

Outro bom exemplo de como a IA pode ser utilizada para coreografia é o projeto"Dance to Music" do NVIDIA. Neste projeto, utilizaram a IA e um processo em duas etapas para gerar novos movimentos de dança que são diversos, consistentes com o estilo e que correspondem à batida. Primeiro, utilizaram a estimativa de pose e um detetor cinemático de batida para aprender vários movimentos de dança na batida a partir de uma grande coleção de vídeos de dança. Depois, um modelo de IA generativo foi utilizado para organizar estes movimentos de dança numa coreografia que correspondesse ao ritmo e ao estilo da música. Os movimentos de dança coreografados por IA acrescentam um elemento visual interessante aos vídeos de música e ajudam os artistas a serem mais criativos.

Impacto nos ouvintes

Para os ouvintes, a IA pode melhorar a descoberta de música e a experiência de audição. Plataformas como o Spotify e a Apple Music estão a utilizar a IA para criar listas de reprodução personalizadas e recomendar novas músicas com base nos hábitos de audição dos utilizadores. Quando descobres novos artistas e géneros nestas plataformas, é essa a magia da IA. 

A realidade virtual (RV) alimentada por IA também está a melhorar as experiências de concertos ao vivo. Por exemplo, Travis Scott utiliza a RV para criar actuações virtuais que chegam a audiências globais. No entanto, a abundância de música gerada por IA em plataformas como o TikTok pode tornar a descoberta de música avassaladora. Pode tornar difícil para os novos artistas destacarem-se.

Figura 4. A IA torna possíveis as experiências de concertos em realidade virtual (RV).

Impacto nos produtores

Os produtores beneficiam da IA de várias formas. As ferramentas de IA que ajudam na correção do tom, na mistura e na masterização simplificam o processo de produção. Os instrumentos e sintetizadores virtuais alimentados por IA, como o Watson Beat da IBM, podem criar novos sons e texturas que expandem as possibilidades criativas. 

A IA nas plataformas de streaming não é apenas uma vantagem para os ouvintes; também ajuda os produtores ao criar um público mais vasto. No entanto, tal como os músicos, a capacidade da IA para imitar o estilo de artistas estabelecidos levanta questões éticas e legais sobre a exploração das vozes e estilos únicos dos artistas. Isto resultou em disputas legais, tais como acções judiciais de grandes empresas de música como a Universal, a Sony e a Warner contra startups de IA como a Suno e a Udio por alegadamente utilizarem obras protegidas por direitos de autor para treinar os seus modelos sem autorização.

Gerir bibliotecas de música com ferramentas integradas de IA como o MusicBrainz Picard

Explorámos brevemente algumas aplicações da IA na música, compreendendo o seu impacto nos diferentes intervenientes da indústria musical. Agora, vamos compreender uma aplicação mais específica da IA na música: Ferramentas de gestão de música com IA, como o MusicBrainz Picard. Estas ferramentas são incrivelmente úteis para organizar e gerir bibliotecas de música digital. 

Figura 5. As bibliotecas de música podem ser geridas com recurso à IA.

Identifica e etiqueta automaticamente os ficheiros de música com metadados precisos, tais como nomes de artistas, títulos de álbuns e números de faixas. O MusicBrainz Picard facilita a manutenção de colecções de música bem organizadas. Uma das principais tecnologias integradas no MusicBrainz Picard são as impressões digitais de áudio AcoustID. Estas impressões digitais identificam ficheiros de música com base no seu conteúdo áudio real, mesmo que os ficheiros não tenham metadados.

Porque é que isto é tão importante? Grandes organizações como a BBC, Google, Amazon, Spotify, e Pandora confiam nos dados do MusicBrainz para melhorar os seus serviços relacionados com a música. Os metadados criados por ferramentas como o MusicBrainz Picard são cruciais para os programadores que criam bases de dados de música, aplicações de etiquetagem ou outro software relacionado com música. A espinha dorsal da IA são os dados e, sem ferramentas como o Picard, seria muito difícil ter os dados limpos e exactos necessários para a análise e o desenvolvimento de aplicações. É fascinante que as ferramentas melhoradas pela IA utilizem a IA e ajudem a criar os dados necessários para as aplicações de IA, formando um ciclo benéfico de melhoria e inovação.

Notas finais sobre a IA na música

Já falámos sobre as ondas que a IA está a criar na música. O panorama jurídico em torno da música gerada por IA também está a evoluir. Os regulamentos actuais, como os do Gabinete de Direitos de Autor dos EUA, estipulam que as obras geradas inteiramente por IA não podem ser protegidas por direitos de autor, uma vez que não têm autoria humana. No entanto, se um ser humano contribuir significativamente para o processo criativo, o trabalho pode ser elegível para proteção de direitos de autor. À medida que a IA continua a integrar-se na indústria musical, os debates legais e éticos em curso serão vitais para enfrentar estes desafios. Olhando para o futuro, a IA tem um enorme potencial na música, combinando a tecnologia com a criatividade humana para expandir as possibilidades de criação e produção musical.

Explora a IA visitando o nosso repositório GitHub e juntando-te à nossa vibrante comunidade. Aprende sobre aplicações de IA no fabrico e na agricultura nas nossas páginas de soluções.

Logótipo do FacebookLogótipo do TwitterLogótipo do LinkedInSímbolo de ligação de cópia

Ler mais nesta categoria

Vamos construir juntos o futuro
da IA!

Começa a tua viagem com o futuro da aprendizagem automática