12月13日,2020網(wǎng)易未來大會首發(fā)AI原創(chuàng)單曲《醒來》,這也是網(wǎng)易首支詞曲編唱全鏈路AI音樂作品。歌詞生動、旋律動感、歌喉驚艷,展現(xiàn)出AI媲美專業(yè)音樂人的創(chuàng)作能力和歌唱實力。據(jù)了解,《醒來》由網(wǎng)易伏羲、雷火音頻部提供AI技術(shù)支持,從創(chuàng)作到演唱,生成歌曲僅需一小時。這套技術(shù)已應(yīng)用于游戲、文旅、文創(chuàng)等多個領(lǐng)域,是網(wǎng)易伏羲AI技術(shù)應(yīng)用落地的重要成果之一。
AI承包作詞編曲,演唱媲美專業(yè)歌手
“醒來燦爛星光透過了窗臺,海岸線連接了那片山川大海。涌動夢境邊緣像是空曠舞臺,在眼前忽然展開?!睂嶋H上,要讓AI成為“唱作人”,一方面需要讓它具備作詞編曲及演唱在內(nèi)的AI生成技術(shù)能力;更重要的是,還要讓AI擁有音樂審美,能夠基于創(chuàng)意,生成媲美真人專業(yè)創(chuàng)作者的音樂作品。
據(jù)網(wǎng)易伏羲介紹,以《醒來》為例,為了契合大會主題“洞覺·未見”,網(wǎng)易伏羲團隊勾勒了一個故事原型:在不遠(yuǎn)的未來,一個AI生成的虛擬人在深夜醒來;歌曲希望體現(xiàn)出人類與AI將成為最好的伙伴,表達(dá)人類與AI共同開啟未來的期許。
基于創(chuàng)意,在作詞方面,網(wǎng)易伏羲自主研發(fā)的有靈智能創(chuàng)作平臺,會先讓AI學(xué)會人類語言組織的基本邏輯,借助大規(guī)模預(yù)訓(xùn)練的語言模型GPT-2, 實現(xiàn)端到端的歌詞生成。作曲方面,網(wǎng)易伏羲根據(jù)樂理的數(shù)據(jù)分析,形成了一套旋律生成算法,可以在短時間內(nèi)產(chǎn)出多個實用性生成結(jié)果;編曲上,則采用雷火音頻部自研的智能編曲引擎,該引擎覆蓋華語樂壇主流風(fēng)格,15-30秒就能生成一首出版級歌曲。相同質(zhì)量的人工編曲,市場價格在1-1.5萬元。
AI自動完成詞曲創(chuàng)作后,還要讓它擁有堪比真人專業(yè)歌手的演唱能力。所謂歌唱合成,本質(zhì)上是指輸入任意曲譜,可以得出人聲輸出的過程。因此,歌聲智能生成系統(tǒng)需要在聲音音 色、歌曲風(fēng)格等方面有大量數(shù)據(jù)沉淀。網(wǎng)易伏羲已經(jīng)建立了一個龐大的歌唱合成庫,音色豐富,涵蓋古風(fēng)、流行、電子、民謠等主流華語音樂風(fēng)格;通過端到端的歌聲合成,并借助神經(jīng)網(wǎng)絡(luò)聲碼器,可以生成既符合專業(yè)音樂審美,又契合歌曲主題的演唱作品。
AI賦能音樂創(chuàng)作,商業(yè)應(yīng)用前景廣闊
近年來,不論是游戲、電影、電視、動畫片,還是短視頻、網(wǎng)絡(luò)綜藝、虛擬偶像樂隊、在線教育產(chǎn)品,都需要大量高品質(zhì)的音樂內(nèi)容。在爆發(fā)式增長的商業(yè)化音樂制作需求驅(qū)動下,用AI賦能音樂創(chuàng)作,助力音樂工業(yè)化發(fā)展,早已不是天方夜譚。
網(wǎng)易也在“AI+音樂創(chuàng)作”領(lǐng)域積累了大量應(yīng)用案例。編曲方面,網(wǎng)易雷火音頻部作為專業(yè)游戲音頻制作團隊,不僅服務(wù)《逆水寒》《遇見逆水寒》《倩女幽魂》《倩女幽魂手游》等多個爆款游戲的音頻開發(fā);還同時深耕智能音頻生成領(lǐng)域研發(fā),率先部署了工業(yè)出版級智能編曲系統(tǒng),其智能編曲技術(shù)已到達(dá)唱片行業(yè)出版級標(biāo)準(zhǔn),具備工業(yè)化大批量生產(chǎn)的能力。
歌詞創(chuàng)作方面,網(wǎng)易伏羲自主研發(fā)的有靈智能創(chuàng)作平臺作為“AI寫歌詞”的技術(shù)底層,獨創(chuàng)“人機協(xié)同”的歌詞創(chuàng)作輔助模式幫助用戶創(chuàng)作。例如,用戶如果以“雪”作為標(biāo)簽,AI算法會自動推薦與“雪”相關(guān)的場景、意象、畫面,來保證歌詞生成得到更好質(zhì)量;用戶甚至可以只輸入一段自己的故事,在AI的輔助下,故事就可以轉(zhuǎn)換為專屬歌詞。此外,用戶還可以通過有靈AI,完成高質(zhì)量詩詞、歌詞和劇情類文字的創(chuàng)作。
網(wǎng)易伏羲也在積極拓展相關(guān)AI技術(shù)的落地場景。今年11月,杭州中國絲綢城步行街完成改造升級,宣布全面引入網(wǎng)易伏羲的AI前沿技術(shù)及應(yīng)用。體驗區(qū)內(nèi),游客輸入自己的姓名,“AI詩人”及就會創(chuàng)作專屬“藏頭詩”一首;借助實時動作捕捉技術(shù),游客可以與裝置內(nèi)的虛擬人跨屏共舞;按下展館內(nèi)的琴鍵,就可以讓虛擬人“素問”根據(jù)旋律和節(jié)奏翩翩起舞……這些融入音樂、舞蹈、詩歌等AI沉浸式互動體驗,讓年輕人體驗“黑科技”的同時,傳承優(yōu)秀傳統(tǒng)文化。
值得注意的是,國內(nèi)文旅產(chǎn)業(yè)正在迎來發(fā)展新契機。近期發(fā)布的《“十四五”規(guī)劃和二零三五年年遠(yuǎn)景目標(biāo)的建議》提出,實施文化產(chǎn)業(yè)數(shù)字化戰(zhàn)略,推動文化和旅游融合發(fā)展。在這一大背景下,AI與文旅的交融結(jié)合,或許將掀起新一波AI商業(yè)化落地浪潮。