新智元報道
編輯:拉燕
【新智元導讀】
幻想一下自己的聲音變成好萊塢男神——摩根·弗里曼,誰聽誰耳朵不懷孕啊。
都聽說過變聲器吧。
3歲小孩能發出70歲老爺爺的聲音,50歲大媽能發出18歲帥小夥的聲音。
小編也見過那種奇奇怪怪的變聲器廣告,用於一些不可言說的目的。
不過,今天要聊的變聲器可不是上面這些。
今天的主角,是AI變聲,是不是比那些變聲器要高階多了?
AI處理+實時變聲,看了就想用
Voicemod是啥?
一款平平無奇的用AI操作的實時變聲器罷了。
再往下聽聽呢?
Voicemod能把你的聲音變成摩根弗里曼、變成飛行員、變成航天員等八種不同角色。
最近,Voicemod釋出了最新的測試版本。
聽名字就知道,Voicemod就是專門幹這個的。多年來,Voicemod一直致力於應用人工智慧來改變人們的聲音。
而上面提到的摩根弗里曼的聲音是其中最有特色的。任何人都可以透過Voicemod把自己的聲音變成這位著名影星。
而且,Voicemod並不只是在改變人的聲音下了功夫,他們還透過給聲音加入環境音,來營造一種逼真的氛圍。
比方說,飛行員這個選項就能讓使用者的聲音聽起來像他真的在駕駛一架飛機一樣。
而且,所有的聲音改變都是實時的,也就是不需要傳統變聲器的反應處理時間。
使用者可以在直播軟體上,或是影片通話時改變自己的聲音,製造點節目效果什麼的。
所有聲音的資料庫都由以英語為母語的專業配音演員輔助生成,而配音演員的聲音和Voicemod重建的聲音是匹配的。
配音演員念指令碼錄音,生成資料,供人工智慧模型學習。然後,聲音設計師再用傳統的聲音設計技巧把錄好的聲音轉化成最終的成品。比如弗里曼的聲音等等。
而就像上面提到的飛行員聲音一樣,許多生成的聲音還包括各種動態效果、過濾器,以及背景音樂。
手機PC都能跑,算力有要求
如果用個人計算機來執行Voicemod的AI生成功能的話,就會需要更多的CPU算力。最起碼比普通的Voicemod功能需要更多。
而最近Voicemod也是開啟了全新的測試版,使用者可以先跑一下試試,看看自己的計算機能不能執行Voicemod的新功能,會不會出現漏音,或是其它效能方面的問題。
現在Voicemod的主要版本只能在個人計算機上使用,Mac版還得期待一下。
隨著時間的推移、技術的發展,合成聲音變得越來越逼真,也越來越令人印象深刻。
雖然AI生成的聲音是個新事物,但是像Resemble AI,還有Respeecher這些工具都已經展示出了內容建立者的潛力。聲音編輯者可以用語音克隆的辦法來進行編輯。
目前Voicemod AI生成聲音的功能主要為了內容創作者服務。他們能用上這項技術,從一個側面表明了我們每一個人和自由生成聲音之間,並不遙遠。
我們每一個人都可能是內容創作者,我們是AI聲音技術發展浪潮中很重要的一份子。
另外,值得一提的是,Voicemod還推出了PowerPitch技術,能讓使用者為不同的環境或場合生成不同的語音身份。
就類似於,打遊戲有軟妹音,開會有霸總音,在學校有學生音等等。
除了用於娛樂和惡作劇以外,還能讓數百萬語音障礙患者從中受益。藉助這個工具,語音障礙患者可以改善自身聲音的音調、響度、音色,等等各類問題。
再往深一步想,這項技術還能讓跨性別者受益,也就是lgbt裡那個t。
雖說現在人工智慧還沒有被應用在PowerPitch上,但使用者能用AI生成的語音來開會、打電話估計也能很快實現。
參考資料:https://www。theverge。com/2022/6/15/23169012/voicemod-morgan-freeman-ai-voice-astronauts-pilots