智能座艙的語音系統(tǒng)被稱為VOS(語音操作系統(tǒng)),主要負責座艙內用戶和車機的語音交互。在系統(tǒng)架構上,VOS系統(tǒng)分為車機和算法兩部分。VOS系統(tǒng)的車機系統(tǒng)包括車云兩端。車端和駕車人員直接交互的模塊叫做對話系統(tǒng)(DS),其主要由麥克風陣列、喚醒模塊、音頻處理模塊組成。為了實現(xiàn)更好的語音交互體驗,DS的音頻處理模塊功能非常豐富,包括AEC、VAD、音頻壓縮、喚醒詞識別、聲源定位等。 VOS的云端部分主要用于實現(xiàn)在線語音功能,包括在線ASR識別、對話服務以及實時信息同步等。 當然,上述功能的實現(xiàn)都離不開算法的支持,算法是智能座艙VOS的靈魂。對于算法而言,兩種類型的數(shù)據(jù)最為關鍵。一種是原始訓練數(shù)據(jù),主要用于實現(xiàn)VOS系統(tǒng)的各種功能定義和喚醒,以及打造喚醒詞庫;另一種是用戶的個人數(shù)據(jù),這是系統(tǒng)算法逐漸體現(xiàn)私人定制屬性的關鍵所在,一般VOS系統(tǒng)會不定期地采集、標注用戶數(shù)據(jù),結合系統(tǒng)大數(shù)據(jù)不斷提升VOS系統(tǒng)的智能化水平。 從發(fā)展趨勢來看,智能座艙VOS系統(tǒng)已經逐漸從雙音區(qū)變化為四音區(qū),在駕駛員、副駕、后排左側和后排右側四個區(qū)域都能實現(xiàn)很好的定位識別,通過聲源定位的方式鎖定當前發(fā)布指令的音區(qū)。在此基礎上,廠商在逐漸嘗試對VOS系統(tǒng)進行“喚醒連說”,也就是用戶在喚醒系統(tǒng)之后可以不用等待系統(tǒng)反饋音,而是將喚醒詞和指令同時說出。此外,部分VOS系統(tǒng)也在嘗試無喚醒詞下達指令以及離線指令識別,當然這些創(chuàng)新功能對車機硬件的智能化水平要求也比較高。當然,目前的智能座艙不僅會聽回答,也會說會唱。也就是說,現(xiàn)階段的車載聲學系統(tǒng)不僅僅是簡單的交互,而是要打造隔音靜謐性、環(huán)繞式座艙體驗,讓駕乘人員感受到沉浸式的聽覺盛宴。以騰訊TAI4.0智能座艙解決方案為例,其中兩個亮點功能是全民K歌車載版以及騰訊愛趣聽,后者是業(yè)內首個融合音樂、相聲、視頻、新聞、K歌、長音頻等多內容的車載娛樂產品。 豐富的軟件功能就需要硬件來搭配,這也就推動了智能座艙音響系統(tǒng)的大升級。智能座艙音響系統(tǒng)的第一階段是智能音樂座艙,目前小鵬P7、AION LX、領克05等車型都在主打這一理念。這些品牌的智能音樂座艙有一個明顯的共同點就是品牌音響+多揚聲器,其中小鵬P7采用丹拿品牌音響,用了18個揚聲器。當然,除了多揚聲器的升級方案,部分車企還選擇加裝低音炮產品以提高整車音效。 |