作者: 兆光科技 發(fā)布時間: 2024/08/08 點擊: 9077次
盡管版權問題依舊困擾著(zhe)AI生成(chéng)音樂大模型的開(kāi)發(fā),但并沒(méi)有阻礙相關技術的進(jìn)步。
前不久,Meta推出了一款名爲MusicGen的開(kāi)源人工智能(néng)模型,可以根據文本提示或旋律生成(chéng)音樂。
這(zhè)款模型與谷歌今年1月發(fā)布的MusicLM類似,可以基于文本提示或哼唱、演奏的旋律創作音樂。MusicGen在2萬小時的音樂數據上進(jìn)行了訓練,其代碼已經(jīng)在Github上公開(kāi),用戶也可以在Hugging Face上在線測試。
使用MusicGen非常簡單,用戶隻需要輸入一段對(duì)想要聽到的音樂的描述,比如“一種(zhǒng)結合了嘻哈和管弦樂元素的動感音樂,有著(zhe)悠揚的弦樂和銅管樂,喚起(qǐ)了城市的活力氣息。”或者更簡單的描述:“90年代的搖滾歌曲,有吉他的主旋律。”用戶還(hái)可以選擇上傳一首歌曲來幫助生成(chéng)想要的内容。MusicGen會在幾分鍾内生成(chéng)一段12秒的音頻片段。
Meta在6月8日發(fā)表在arXiv預印本服務器上的論文中稱,他們對(duì)MusicGen進(jìn)行了客觀和主觀的評估,并發(fā)現它在音質、旋律和文本适應性方面(miàn)都(dōu)優于其他類似的模型,如MusicLM、Diffusion和Noise2Music。
“MusicGen能(néng)夠産生高質量的樣(yàng)本,它們與給定的和聲結構更好(hǎo)地旋律對(duì)齊,同時遵循文本描述。”Meta在論文中寫道(dào)。這(zhè)款工具被(bèi)認爲是作曲家和表演者的一個寶貴助手。
Meta測試了三個版本的模型,它們在提供音樂細節方面(miàn)有所不同:300百萬、15億和33億參數。在評估中,Meta發(fā)現人類更喜歡中等範圍(15億參數)模型的結果。這(zhè)也許反映了法國(guó)電子音樂制作人Rone對(duì)成(chéng)功音樂制作的理論:“少即是多。”
然而,參數最多的模型生成(chéng)的輸出最能(néng)準确反映文本和音頻輸入。
與此同時,其他音樂生成(chéng)模型也在不斷地提高。比如,Noise2Music是一款基于擴散模型(Diffusion Model)的文本條件音樂生成(chéng)模型。它可以從噪聲開(kāi)始逆向(xiàng)生成(chéng)音樂,并根據文本提示調整風格、情感和節奏。Noise2Music在客觀評估中表現出較高的信噪比(SNR)和譜圖相似度(SSIM),但在主觀評估中得分較低。
另一款基于擴散模型的音樂生成(chéng)模型是Riffusion,它可以根據文本提示或哼唱生成(chéng)吉他獨奏。Riffusion在主觀評估中得到了較高的分數。
業界對(duì)MusicGen的反應不一。
有些人認爲這(zhè)是一個創新和有趣的工具,可以激發(fā)音樂創作和欣賞。比如,TechCrunch稱,“随著(zhe)AI項目在其他領域的發(fā)展,生成(chéng)音樂也在明顯地提高(參見Riffusion、Dance Diffusion和OpenAI的Jukebox)。”
有些人則對(duì)這(zhè)種(zhǒng)技術持懷疑或擔憂的态度,認爲它可能(néng)會侵犯版權、損害原創性或降低音樂品質。比如,ummid.com引用了一位不願透露姓名的音樂家的話說,“我不喜歡這(zhè)種(zhǒng)用AI來模仿已有風格或藝術家的做法。我覺得這(zhè)樣(yàng)會失去音樂創作中最重要的東西:靈感和情感。”
随著(zhe)AI項目在其他領域的發(fā)展,不可避免地會出現一些問題,最主要的是關于使用版權材料的法律問題。Meta表示,所有用于訓練MusicGen的歌曲都(dōu)已經(jīng)通過(guò)與版權持有者的法律協議進(jìn)行了清理。但是,用戶如果在描述中添加了一首歌曲或藝術家的名字,可能(néng)會打開(kāi)潘多拉盒子,導緻版權侵權。
盡管版權問題依舊困擾著(zhe)AIGC大模型的開(kāi)發(fā),但并沒(méi)有阻礙相關技術的進(jìn)步,也沒(méi)有成(chéng)爲一些進(jìn)步人士選擇向(xiàng)AI靠攏,并利用AI推動自己或業界的發(fā)展的絆腳石。
比如,Spotify的首席執行官Daniel Ek在今年4月的财報電話會議上表示,他們正在與音樂行業合作,解決AI相關的問題,同時也鼓勵其平台上的創新。
另一個例子是Grimes,她是前特斯拉首席執行官埃隆·馬斯克的前伴侶,也是他兩(liǎng)個孩子的母親。她在今年4月在推特上表示,她願意與任何使用她的聲音生成(chéng)音樂的AI公司分享版權收入。她說:“我覺得這(zhè)是一種(zhǒng)很酷的藝術形式。”
還(hái)有一個例子是OpenAI,這(zhè)是一個緻力于創建和推廣友善AI的非營利組織。它在去年發(fā)布了一款名爲Jukebox的AI模型,可以根據文本提示或歌曲片段生成(chéng)音樂。它在其網站上聲明,它尊重原創音樂家和版權持有者的權利,并提供了一些指導原則和建議,以避免侵犯版權或濫用其技術。OpenAI表示:“我們希望Jukebox能(néng)夠爲音樂産業帶來新的機遇和挑戰,同時也尊重原創音樂的價值和意義。”
Meta表示,他們希望MusicGen能(néng)夠爲音樂産業帶來新的機遇和挑戰,同時也尊重原創音樂的價值和意義。
“我們相信,AI可以成(chéng)爲人類創造力的一個強大的夥伴,而不是一個威脅或競争者。”Meta在論文中寫道(dào)。“我們希望MusicGen能(néng)夠激發(fā)更多的音樂愛好(hǎo)者和專業人士,探索新的音樂領域和風格,同時也保持對(duì)音樂藝術和文化的敬畏和尊重。”
标簽: AI
版權申明:本站文章部分自網絡,如有侵權,請聯系:hezuo@lyzg168.com
特别注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯系,版權歸原作者所有
輸入您的聯系信息,我們將(jiāng)盡快和你取得聯系!
Tel:15137991270
企業QQ:210603461
Emile:hezuo@lyzg168.com
地址:洛陽市西工區王城大道(dào)221号富雅東方B座1711室
網站:https://www.lyzg168.com
我們的微信
關注兆光,了解我們的服務與最新資訊。
Copyright © 2018-2019 洛陽霆雲網絡科技有限公司