廣州車展丨把丹拿們從車上扔掉

技術平權,是我聽過最浪漫的詞。透過技術上的努力,讓每個人都能平等、有尊嚴地享受豐富多彩的現代文明,這才是技術進步的魅力。

廣州車展前夕,科大訊飛正式釋出了“飛魚音效”產品,透過端雲協同的人工智慧演算法進行調音,軟硬一體的方案使普通車主也能擁有百萬豪車的聽覺體驗。

該套“飛魚音效”將搭載在智己、廣汽傳祺、奇瑞等品牌的車型上。

科大訊飛請了多位音樂學院的學生,體驗某豪華品牌中大型SUV的原車高階音響,及科大訊飛改裝的某10萬級國產SUV音響。經過多維度的盲評,後者的各項表現都要優於前者。

廣州車展丨把丹拿們從車上扔掉

科大訊飛總裁吳曉如在介紹“飛魚音效”前,舉了相機和手機的例子。過去攝影只是屬於少數人的愛好,因為相機很貴且功能單一,而現在隨著手機影畫素質越來越好,越來越多人可以隨時用鏡頭記錄生活,甚至還催生了用Vlog、短影片來分享生活。

手機受制於成本和尺寸,鏡頭和感測器並不可能比相機好,能做到現在的狀態,依靠的是手機的成像演算法、補償演算法、合成演算法、光學防抖演算法等一系列的智慧軟體的加持,拉高了硬體的體驗。

科大訊飛“飛魚音效”的做法和手機相機的逆襲類似,也是透過軟體演算法,拉高硬體的體驗,讓普通硬體也能達到豪華硬體的水準。具體是怎麼做到的呢?

“飛魚音效”的秘密

我們通常認為“身臨其境”,是對聽覺體驗最高的讚賞,畢竟去現場看話劇比看電影貴,現場聽音樂會也比聽數字CD貴。

因此想知道“智慧演算法是如何提升硬體體驗”,就得先聊聊人是如何透過聽覺來感知環境的?

我們閉上眼睛,可以聽到不同的聲音的強弱層次,以及各個聲源位於我們的位置。不同聲音的區分是來自我們大腦內的記憶儲存,聲音的強弱則來自音量和距離,而聲源的定位則依靠我們耳朵的結構,以及聲音入耳的角度。

具體來說,我們是透過聲音在左右耳之間的延遲,來判斷聲源水平方位,透過耳廓對聲波的反射,獲取聲源的垂直方位。

如果能夠透過精細化的調校模擬出不同聲音的音量、離左右耳的距離,在耳廓中的反射,就能實現虛擬聲學空間,在汽車的座艙中營造立體的、高還原度的聲場。

廣州車展丨把丹拿們從車上扔掉

在這一過程是非常難的。很多對座艙聽覺體驗有要求的車型,都擁有10個以上揚聲器,每個揚聲器有3到4個喇叭,每個喇叭都需要協同調節,引數量非常大。這種多引數的系統調優耗時耗力,但現階段多數都是依靠“金耳朵”們人力完成的。因此對一套動輒上萬元的音響系統而言,調校是當下成本的大頭。

此外受制於座艙內空間有限,揚聲器安裝的位置也不夠靈活,但多數的音響系統調校,都是基於音樂廳、家庭影院,沒能很好適配座艙場景,因此也無法最大化發揮昂貴硬體系統的價值。

科大訊飛的做法是,透過採集艙內每一個位置接收不同喇叭聲音的引數,透過人工智慧演算法針對座艙場景自動調優,減少了聲源調校的人力成本和時間成本。

廣州車展丨把丹拿們從車上扔掉

做到這些還不夠,科大訊飛依靠自身強大的語音人工智慧技術,將各類聲音做實時的元素分離,精準還原聲場。例如為了還原一場電影的聲音效果,會將聲道中不同人的對話、BGM聲、背景直升機的聲音、海浪的聲音、海鳥的叫聲等分離出來,再根據人耳的位置,按照不同方向、頻率、音量等做精細化分佈,從而聽起來更有層次感和指向性。

為了軟硬一體提升座艙聽覺體驗,科大訊飛釋出了“飛魚智慧音訊管理系統”,支援10路麥克風接入、6路感測器接入、和對26個揚聲器單元的管理。“飛魚智慧音訊管理系統”搭配不同數量的普通揚聲器,可實現不同梯度的座艙聽覺體驗。

廣州車展丨把丹拿們從車上扔掉

電動汽車擁有更高的電壓、更多的帶電量,為座艙的聽覺提升提供了基礎,車主們對電動汽車的聽覺需求也會越來越高。科大訊飛的“飛魚音效”,能夠透過智慧演算法的加持,實現技術平權,讓優質的聽覺體驗不再是需要花近10萬費用加裝的奢侈品。

融入飛魚OS的場景化服務

場景這個詞愈發頻繁地進入我們的視野,自動駕駛需要場景化落地,智慧座艙也需要針對不同場景做更精細化的服務。本次科大訊飛的釋出會,飛魚OS也增加了很多針對場景做的使用者體驗最佳化設計。簡單來分享幾個我認為很棒的設計。

廣州車展丨把丹拿們從車上扔掉

融合視覺的動態完美“皇帝位”。透過座艙攝像頭獲取的座艙資訊,就可以知道當前車內該服務的“聽”者是誰,從而做到自動切換聲場。同時視覺演算法可以捕捉耳朵的位置,做到動態的聲場定位。當一個人開車時,系統會讓音響的“皇帝位”跟著主駕駛的耳朵走。這相對於此前在車內調校幾個固定聲場,再在車機螢幕上手動切換,使用者體驗是質的飛躍。

飛魚音效和輔助駕駛的融合體驗。輔助駕駛系統啟用下,座艙會有很多的提示資訊和提示音,飛魚OS希望透過ADAS的感知資料,讓提示音能夠和障礙物的方位保持一致。例如當左前方有車近距離Cut in,觸發系統警報聲,就會從左前方傳來。這樣避免了輔助駕駛系統下訊息過密,影響體驗。

廣州車展丨把丹拿們從車上扔掉

融合視覺的車內無障礙交流。同樣是透過座艙攝像頭或許視覺資訊,當透過唇部判斷兩個人在聊天時,系統會主動降低這兩個位置聽到的聲音音量,讓聊天資訊更清晰。如果是兩個坐在前後排,且車在高速上噪音比較大時怎麼辦?還有車內交流補償,就是透過一側的麥克風降噪收聲,然後再在另一個乘客座位的音響內播放,這樣來個迴圈,就能確保兩個人在環境噪音較大的情況下無障礙交流。當然,打電話時的收聲降噪問題,早就不算問題了。

廣州車展丨把丹拿們從車上扔掉

場景定製。可以針對具不同的場景做不同的定製化體驗,例如定製看電影的專屬調校、聽音樂的專屬調校、放鬆的森林小屋場景,還有KTV車內唱歌的場景。這些場景不僅會對揚聲器和聲場做專屬最佳化,還會和生態商一起做最佳化。舉個例子,KTV場景下,對伴奏聲做聲場調校,還會在收聲後做聲音的最佳化處理,讓你覺得自己唱的更好聽。

語音流轉。語音電話打進來了,聊到一半,想讓後排的乘客繼續聊,只需要在螢幕上劃一下,就能將聲音和收聲都移動到該駕駛位。

每個座位專屬的語音TTS。同一個語音助手,在不同的座位,可以用不同的TTS存在,也會變得很有趣。想象一下主駕交流使用時是成熟的大人聲,而後排的小朋友在後排聽到的是童聲,每個座位都能聽到自己想象中人工智慧應該有的聲音。

透過不同聲音的元素分離技術,精細化的揚聲器和麥克風控制,以及視覺人工智慧的相結合,座艙在娛樂、辦公等不同需求下的使用者體驗升級,會打來非常大的想象空間。

寫在最後:

介紹完“飛魚音效”以及飛魚OS的場景化服務,再來分享一個不那麼有趣的故事。

科大訊飛蘇州研發院的團隊,在做完“飛魚音效”後,邀請了某家車企合作伙伴來體驗。對方體驗完,表示“飛魚音效”的表現,在各方面都比進口的名牌音響系統要好,但自家依然不會買。

原因大家都懂的,畢竟聲音的優異對很多人而言是“玄學”,而一個響噹噹的國外牌子刻在顯眼的位置,確實更吸引人。

擁抱變化真的是一件艱難且需要勇氣的事。

TAG: 飛魚體驗座艙科大音效