日本不卡一区视频-日本不卡视频一区二区三区-日本不卡视频一区二区-日本不卡高清免费v日本-色国产视频

產(chǎn)品分類

當(dāng)前位置: 首頁 > 工業(yè)電子產(chǎn)品 > 其他電子產(chǎn)品 > 揚(yáng)聲器

類型分類:
科普知識
數(shù)據(jù)分類:
揚(yáng)聲器

將語音助手集成到便攜式揚(yáng)聲器和智能耳機(jī)中

發(fā)布日期:2022-10-09 點(diǎn)擊率:74

諸如 Amazon 的 Alexa、Apple 的 Siri、Microsoft 的 Cortana 和 Google Assistant 之類的虛擬助手,正在推動智能語音設(shè)備創(chuàng)新——從與智能手機(jī)和其他移動設(shè)備配對的藍(lán)牙耳機(jī),到家庭和辦公室自動化環(huán)境中的智能揚(yáng)聲器,還有電視等消費(fèi)類電子產(chǎn)品。雖然語音服務(wù)越來越多地用于控制聽音樂、打電話、運(yùn)行生物識別傳感器之類的功能,但是設(shè)計人員發(fā)現(xiàn),在聲音和電噪聲均很大的環(huán)境中,想要識別、采集和無線傳輸語音是一個挑戰(zhàn)。

若要應(yīng)對挑戰(zhàn),需要強(qiáng)大的噪聲消除技術(shù)和同樣強(qiáng)大的無線接口,所有這些都應(yīng)打包成一個解決方案,以便開發(fā)人員進(jìn)行試驗(yàn)并迅速應(yīng)用,節(jié)省時間和成本。

本文介紹 Cirrus Logic、XMOS 和 Qualcomm 的幾種語音采集解決方案,這些方案可幫助設(shè)計人員快速開始新一代支持語音的移動設(shè)備和耳機(jī)設(shè)計。

語音采集解決方案

當(dāng) Apple 和 Microsoft 等公司開始對智能手機(jī)和計算機(jī)實(shí)施相應(yīng)的解決方案時,Amazon 則推出配備 Echo 智能揚(yáng)聲器的 Alexa,然后開始將其擴(kuò)展到更多設(shè)備中。

但是,Echo 內(nèi)置有 7 個麥克風(fēng),這對于空間、成本、功耗都非常寶貴的小型手持設(shè)備而言,可謂是太多了。雖然如此,Cirrus Logic 等芯片制造商加入進(jìn)來,推出更簡單的設(shè)計解決方案,讓設(shè)計人員能將 Alexa 集成到各種智能設(shè)備和其他尺寸的音頻系統(tǒng)中。

例如,采用 Alexa 語音服務(wù) (AVS) 的智能家居應(yīng)用(支持通過語音控制照明和電器)、免提便攜式揚(yáng)聲器和聯(lián)網(wǎng)揚(yáng)聲器。這些應(yīng)用需要語音采集解決方案來抑制噪聲和其他現(xiàn)實(shí)存在的干擾,增強(qiáng)用戶體驗(yàn),提供更準(zhǔn)確、更可靠的語音交互。

在嘈雜的環(huán)境中和音樂播放期間,必須具備高精度的喚醒詞觸發(fā)和命令解讀,才能實(shí)現(xiàn)語音助手功能。回音消除對于實(shí)現(xiàn)出色的用戶體驗(yàn)也非常重要。通過消除回音,用戶將能中斷響亮的音樂播放和 Alexa 響應(yīng),從而使得新請求可以得到準(zhǔn)確響應(yīng)。

要嘗試 AVS 設(shè)計,不妨使用 Cirrus Logic 針對 AVS 的語音采集開發(fā)套件 598-2471-KIT,這是一個不錯的開端。該套件旨在將 Alexa 功能集成到含有聲音調(diào)諧音頻處理軟硬件組件的緊湊型音頻設(shè)備中(圖 1)。它基于 Raspberry Pi 3 平臺,包括一個參考板,其中有 Cirrus Logic 的 CS47L24-CWZR 智能編解碼器、數(shù)字 MEMS 麥克風(fēng)和 SoundClear? 算法,支持語音控制、噪聲抑制和回音消除。

Cirrus Logic 的 598-2471-KIT 語音采集開發(fā)套件圖片圖 1:Cirrus Logic 針對 AVS 設(shè)備的 598-2471-KIT 語音采集開發(fā)套件支持將語音采集板(右上方)連接到 Raspberry Pi 3(左上方),方法是通過電纜或作為 HAT 放置在 Raspberry Pi 3 之上。(圖片來源:Cirrus Logic)

語音采集構(gòu)件

語音采集過程始于 CS47L24 語音處理器,其集雙核 300 MMAC DSP 與音頻中樞編解碼器于一體,能夠服務(wù)于各種高能效的固定功能音頻處理模塊(圖 2)。可編程 DSP 核心支持一系列高級音頻處理特性,例如多麥克風(fēng)噪聲抑制、聲學(xué)回波消除 (AEC) 和語音識別。

Cirrus Logic 的 CS47L24 語音處理器示意圖圖 2:套件上的語音采集始于 CS47L24 語音處理器,其集雙核 300 MMAC DSP 與音頻中樞編解碼器于一體,能夠服務(wù)于各種高能效的固定功能音頻處理模塊。(圖片來源:Cirrus Logic)

CS47L24 智能編解碼器利用片上數(shù)模轉(zhuǎn)換器 (DAC) 和 2 W 單聲道揚(yáng)聲器驅(qū)動器,來實(shí)現(xiàn)高保真音頻播放。它支持自動采樣率檢測,有5助于寬帶和窄帶語音呼叫切換。CS47L24 處理器提供了三個數(shù)字音頻接口,每個接口支持一系列標(biāo)準(zhǔn)音頻采樣率和串行接口格式。

CS47L24 由 1.8 V 和 1.2 V 外部電源供電,其電源、時鐘和輸出驅(qū)動器架構(gòu)均針對低功耗而設(shè)計,支持語音、音樂和待機(jī)模式。CS47L24 還提供單獨(dú)的 MICVDD 輸入,以支持 1.8 V 以上的麥克風(fēng)操作。

數(shù)字 MEMS 麥克風(fēng) IC 和相關(guān) SoundClear 算法支持語音控制、噪聲抑制和回音消除,可在輸入端提供高質(zhì)量音頻,同時能降低麥克風(fēng)功耗。該 IC 支持兩種工作模式:低功耗模式和高性能模式,前者適合始終在線語音活動檢測,后者針對高保真錄音進(jìn)行優(yōu)化。模式是由所施加的時鐘頻率來確定。

麥克風(fēng)集成了模數(shù)轉(zhuǎn)換器 (ADC),可利用脈沖密度調(diào)制 (PDM) 編碼輸出單比特數(shù)據(jù)流,以及在立體聲和陣列配置有效連接多個麥克風(fēng)。對設(shè)計人員來說,多麥克風(fēng) IC 很重要,因?yàn)榭蓪ζ溥M(jìn)行優(yōu)化,利用波束形成技術(shù)實(shí)現(xiàn)主動降噪和回音消除,實(shí)現(xiàn)超清晰全雙工通信和音頻采集。

MEMS 麥克風(fēng)還應(yīng)在本底噪聲和聲學(xué)過載點(diǎn)之間提供較寬的動態(tài)范圍(100 dB 是一個很好的起點(diǎn)),以便在安靜和嘈雜的環(huán)境中均能進(jìn)行高保真音頻錄制。例如,它能錄制古典音樂或語音之類的低音量音頻內(nèi)容,而不會有背景嘶嘶聲。同時,它能確保搖滾音樂會和風(fēng)聲之類的響亮聲音不會引起麥克風(fēng)失真。

為了充分利用硬件,SoundClear 算法通過噪聲抑制、自動語音識別 (ASR) Enhance?、回音消除等處理功能來消除噪聲。

遠(yuǎn)場語音采集

另一種語音采集解決方案是 XMOS 的 XK-VF3500-L33-AVS VocalFusion? 立體聲開發(fā)套件,適用于 Amazon 的 AVS。此套件聚焦于遠(yuǎn)場使用場景,例如智能電視、條形音箱、機(jī)頂盒、數(shù)字媒體適配器等。這些應(yīng)用需要立體聲 AEC 以支持“全房間”語音接口解決方案,讓用戶可以通過語音命令打開電視和調(diào)節(jié)臺燈。

遠(yuǎn)場語音采集應(yīng)用要求準(zhǔn)確校準(zhǔn) AEC 基準(zhǔn)信號,并仔細(xì)調(diào)整延遲時間。這樣做后,設(shè)計人員便可確信,無論內(nèi)容量和周圍環(huán)境如何,其設(shè)計的遠(yuǎn)場語音配件都能聽到并準(zhǔn)確捕獲用戶的語音命令。

VocalFusion 套件是一種線性麥克風(fēng)陣列解決方案,已通過 Amazon 遠(yuǎn)場性能認(rèn)證。它讓設(shè)計人員可以將 Alexa 放入智能電視、照明和家用電器等房間邊緣的設(shè)備中。該套件基于 XVF3500-FB167-C 語音處理器構(gòu)建,提供雙通道全雙工 AEC 來支持復(fù)雜聲學(xué)環(huán)境中的語音采集(圖 3)。支持 DSP 的 AEC 功能有利于去混響、自動增益控制和噪聲抑制,確保即使在嘈雜的環(huán)境中也能實(shí)現(xiàn)清晰的語音交互。

XMOS 的 XVF3500 語音處理器示意圖圖 3:XVF3500 語音處理器采用自適應(yīng)波束形成來定位目標(biāo)語音源,并將語音命令與立體聲音頻有效隔離,同時抑制背景噪聲和室內(nèi)回音。(圖片來源:XMOS)

接下來,四麥克風(fēng) VocalFusion 套件使用 Infineon 的 XENSIV? IM69D130V01XTSA1 MEMS 麥克風(fēng),這些麥克風(fēng)提供原始音頻數(shù)據(jù),以便在 XVF3500 語音處理器上運(yùn)行音頻信號處理算法。IM69D130 麥克風(fēng)提供遠(yuǎn)場和耳語拾音性能,在最高 128 dB 的聲壓級 (SPL) 下總諧波失真 (THD) 不到 1%。

語音采集設(shè)計提供的“打斷”功能允許用戶中斷或暫停正在播放音樂的設(shè)備,這就為立體聲家庭娛樂和壁掛式影音設(shè)備中基于 Alexa 的設(shè)計提供了新的機(jī)遇(圖 4)。

語音采集處理器和麥克風(fēng)的示意圖(點(diǎn)擊放大)圖 4:語音采集處理器和麥克風(fēng)相互配合,為遠(yuǎn)場 Alexa 應(yīng)用提供語音接口。(圖片來源:Infineon Technologies)

一個實(shí)際實(shí)施的示例就是創(chuàng)維的基于 XVF3500 語音處理器的人工智能 (AI) 電視。這種始終開啟的智能電視能夠喚醒并響應(yīng)語音命令,具備 180° 全方位聲源識別功能,有效范圍為 5 米 (m)。

智能耳機(jī)設(shè)計

設(shè)計工作的另一端是耳塞和耳機(jī)。與智能手機(jī)和平板電腦配合使用時,這些設(shè)備日益需要集成語音助手來支持日歷管理、智能家居控制、音樂流播放和天氣更新。同智能揚(yáng)聲器一樣,藍(lán)牙耳機(jī)也需要不斷改進(jìn),以在嘈雜的環(huán)境中傳輸高質(zhì)量音頻。

Qualcomm 提供適用于 AVS 和 Google Assistant 平臺的智能耳機(jī)參考設(shè)計與開發(fā)套件,這些主要構(gòu)件能夠支持開發(fā)人員著手設(shè)計聲控耳機(jī)和耳穿戴設(shè)備。參考板可幫助開發(fā)人員評估語音助手,而設(shè)計套件則允許設(shè)計工程師轉(zhuǎn)移到完整開發(fā)環(huán)境。

以 Qualcomm 針對 Google Assistant 的 DK-QCC5124-GAHS-A-0 智能耳機(jī)開發(fā)套件為例。此產(chǎn)品支持安裝了 Google Assistant 應(yīng)用的 Android 手機(jī)通過按鈕激活 Google 語音助手。它基于 Qualcomm 藍(lán)牙音頻芯片組構(gòu)建,其中采用 Qualcomm 清晰語音采集 (cVc?) 降噪技術(shù),通過噪聲抑制和其他音頻增強(qiáng)功能來降低環(huán)境聲音,從而改善呼叫者的聲音。

cVc 6.0 技術(shù)通過一套降噪算法來掩蔽丟包和誤碼,從而提供清晰的通話效果。Qualcomm 的 aptX? HD 是另一項引人注目的技術(shù),有助于降低延遲以實(shí)現(xiàn)穩(wěn)健的音頻流。這是一種高清藍(lán)牙音頻編解碼器,旨在提高信噪比并降低背景噪聲。

Qualcomm 針對 Amazon AVS 的 DK-QCC5124-AVSHS-A-0 智能耳機(jī)參考設(shè)計同樣支持 cVc 6.0 降噪和 aptX HD 無線音頻技術(shù)。它支持安裝了 Alexa 應(yīng)用的手機(jī)通過按鈕激活 Alexa。

該平臺基于 Qualcomm 的 QCC5124 藍(lán)牙收發(fā)器芯片組構(gòu)建,而且支持 Alexa Mobile Accessory (AMA) 套件,后者允許用戶方便地將藍(lán)牙與 Android 和 iOS 設(shè)備上的 Alexa Mobile 應(yīng)用連接起來(圖 5)。AMA 套件有助于將耳機(jī)中的語音命令通過手機(jī)傳達(dá)給 Alexa,而 Amazon AVS 承擔(dān)自然語言處理的繁重任務(wù)。

Qualcomm 針對 Amazon AVS 的 DK-QCC5124-AVSHS-A-0 開發(fā)板示意圖圖 5:針對 Amazon AVS 的 DK-QCC5124-AVSHS-A-0 開發(fā)板具有智能耳機(jī)設(shè)計的關(guān)鍵構(gòu)件。(圖片來源:Qualcomm)

這意味著兩件事:第一,開發(fā)人員無需為 Alexa 集成而檢查大量代碼;第二,開發(fā)人員無需在藍(lán)牙連接之外添加任何通信硬件。

在更高層次上,AMA 套件使得 Amazon AVS 能夠幫助語音配件(如智能耳機(jī))與 Alexa 服務(wù)進(jìn)行通信,通信使用的控制機(jī)制在語音配件與 Alexa Mobile 應(yīng)用之間運(yùn)行。

評估后,開發(fā)人員可以使用開源板開發(fā)套件。但是,對開源板開發(fā)套件進(jìn)行編程需要使用 Transaction Bridge (DK-TRBI200-CE684-1),套件中未包含此工具,不過可以另行購買。

總結(jié)

對于希望將語音助手集成到下一個設(shè)計中的設(shè)計人員而言,硅供應(yīng)商在喚醒詞識別、噪聲消除、低功耗始終開啟功能方面已經(jīng)完成了大量繁重工作。設(shè)計人員可以使用參考設(shè)計和開發(fā)套件來開發(fā)語音采集解決方案,以支持從智能耳機(jī)和智能揚(yáng)聲器到全屋語音控制等一系列智能語音控制服務(wù)。

 

下一篇: PLC、DCS、FCS三大控

上一篇: 如何通過自舉法解決模

推薦產(chǎn)品

更多
主站蜘蛛池模板: | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |