作者: 兆光科技 發(fā)布時間: 2024/08/08 點擊: 5732次
2023年,第二次人工智能(néng)浪潮,因爲大模型的"湧現"能(néng)力不期而至。
事(shì)實上,早在2022年年中,Midjourney、Jasper等圖片生成(chéng)、文字生成(chéng)類AIGC應用就在海外走紅。這(zhè)使得,當全球大佬們還(hái)圍繞底層大模型進(jìn)行"軍備競賽"時,建立在模型基礎上的AI應用,已在數量和類型上“百花齊放”。
36氪日前接觸到的一家公司「音律閃動」,就是一家以AI寫歌爲主營業務的公司,當前正在打磨一款名爲「歌歌AI寫歌」的AI歌曲創作類産品。公司高管告訴36氪,其團隊成(chéng)員長(cháng)期身處音樂領域,早在上一次AI風靡(即Alphago擊敗人類)時,就開(kāi)始探索用AI生成(chéng)音樂。而2022年,出于對(duì)AI寫歌領域的持續看好(hǎo),團隊成(chéng)員聚在一起(qǐ)成(chéng)立了「音律閃動」,希望做出全球領先的AI寫歌類産品。
在全球範圍内,AI創作音樂并非新鮮事(shì)物——Google、OpenAI,和一些國(guó)内外創業公司均有涉獵。但在「音律閃動」團隊眼中,這(zhè)些産品的效果均有不足。
公司COO王樞沛告訴36氪,目前全球範圍内的AI創作音樂産品可分爲三種(zhǒng)技術路線。第一種(zhǒng)是符号音樂生成(chéng)路線。這(zhè)種(zhǒng)方式類似NLP模型的訓練——人們需要先标注大量樂譜,再訓練,最後(hòu)形成(chéng)的産品也是樂譜。但這(zhè)種(zhǒng)方式的弊端在于,生成(chéng)的結果是樂譜而非音樂,"怎麼(me)把樂譜直接變成(chéng)音樂,目前是一個全球範圍内的難題。"王樞沛表示。
另一種(zhǒng)是大模型思路,即直接用海量音頻訓練模型,但這(zhè)種(zhǒng)方式不僅需要高昂資金,生成(chéng)效果也需要提升。王樞沛解釋,音樂裡(lǐ)包含的信息量很大,不僅包括歌詞、人聲和旋律,歌詞裡(lǐ)還(hái)分爲各種(zhǒng)語義信息,人聲裡(lǐ)還(hái)包括口音、感情表現等,旋律則可能(néng)由數十種(zhǒng)樂器演奏而成(chéng),每種(zhǒng)樂器都(dōu)存在自己的演奏方式。"一首歌裡(lǐ)有著(zhe)龐大的信息量,比訓練ChatGPT的難度高很多。"王樞沛表示,當前Google和OpenAI的産品采用這(zhè)類路線,但在音質、音色、歌詞等方面(miàn)還(hái)遠不及商用标準。
還(hái)有一些初創公司走的是"AI剪輯"路線,就是積累龐大的歌曲素材庫,再對(duì)這(zhè)些素材打标,接著(zhe)用AI進(jìn)行剪輯。"嚴格來說,這(zhè)不屬于AI的生成(chéng)。這(zhè)些素材被(bèi)提前準備好(hǎo),再讓AI找出來進(jìn)行拼接。"王樞沛告訴36氪,在體感上這(zhè)類歌曲并不流暢,再加上維護龐大的素材庫需要花費不少成(chéng)本,整體投入産出比不高。
對(duì)比之下,「音律閃動」團隊認爲自身産品生成(chéng)的歌曲已達到商用标準。而且,「歌歌AI寫歌」"是唯一能(néng)做到整曲生成(chéng)的産品"。對(duì)此王樞沛解釋,整曲是說,「歌歌寫AI歌」目前已可以生成(chéng)包括歌詞、人聲、旋律在内的完整音樂。最終,「歌歌AI寫歌」的目标是在數秒内根據用戶Prompt生成(chéng)發(fā)行級的華語流行音樂,并覆蓋全球所有類型音樂。
他進(jìn)一步告訴36氪,「歌歌AI寫歌」采用的并不是大模型路線,而是由多個專業模型和專家系統組成(chéng)而成(chéng)的AI産品。"拿旋律舉例,我們會有一個專有模型去做旋律的生成(chéng)。整體我們有多個專有模型。"他介紹,這(zhè)樣(yàng)做既保證了效果,算力消耗也不大。再加上,公司此前也積累了不少歌曲的版權,所以訓練素材較爲豐富。另外,公司還(hái)積累了把樂譜轉換成(chéng)音樂的音頻算法。王樞沛總結,多種(zhǒng)模型、歌曲版權以及對(duì)音樂的理解是公司的壁壘。
未來,「音律閃動」的目标用戶是全球所有喜歡音樂、唱歌的普通人。公司表示,希望達成(chéng)全球超過(guò)二十億用戶在其平台上進(jìn)行生成(chéng)、創作、分享和版權變現的目标。
當前「歌歌AI寫歌」正在打磨過(guò)程中,計劃在接下來的幾個月内面(miàn)世。"我們還(hái)會在生成(chéng)的歌曲整體效果、生成(chéng)風格的廣度上持續打磨。"王樞沛說。
團隊方面(miàn),公司目前員工人數在20左右。據介紹,CEO龍勇擁有20年音樂制作經(jīng)驗,曾是中國(guó)好(hǎo)聲音、中國(guó)有嘻哈、TME官方合作夥伴,參與制作運營音樂版權總播放量在百億級别,總版稅數億。COO王樞沛是浙江大學(xué)工學(xué)/ 美國(guó)伯克利音樂學(xué)院音樂制作和吉他表演雙專業學(xué)士,曾任網易AI音樂産品負責人。CTO張文鉑曾任阿裡(lǐ)巴巴技術總監,是「我要寫歌」APP創始人。團隊核心成(chéng)員均來自阿裡(lǐ)、網易、字節、Google等音樂AI相關項目。
标簽: AI
版權申明:本站文章部分自網絡,如有侵權,請聯系:hezuo@lyzg168.com
特别注意:本站所有轉載文章言論不代表本站觀點,本站所提供的攝影照片,插畫,設計作品,如需使用,請與原作者聯系,版權歸原作者所有
輸入您的聯系信息,我們將(jiāng)盡快和你取得聯系!
Tel:15137991270
企業QQ:210603461
Emile:hezuo@lyzg168.com
地址:洛陽市西工區王城大道(dào)221号富雅東方B座1711室
網站:https://www.lyzg168.com
我們的微信
關注兆光,了解我們的服務與最新資訊。
Copyright © 2018-2019 洛陽霆雲網絡科技有限公司