WT2605-24SS音頻解碼芯片,實現寵物(玩具)喂食器遠程更新語音技術方案解析
概述:本文主要介紹一種遠程更新語音技術的實現方式,在一些產品應用上,常常會遇到一些需要不停更換語音的場景(如寵物喂食器、寵物玩具需要經常更換聲音,充電樁設備需要更換提示語等等),市面上常用的一些語音芯片大多都無法直接更換語音內容,因此會存在一些無法避免的痛點,有些產品會使用流媒體功能的芯片去播放,但是往往也伴隨著巨大的流量消耗以及網絡傳輸延遲,播放卡頓等現象,本文介紹的這一技術可降低對流量的消耗,下面著重介紹如何實現遠程更新語音這一技術。
一、系統組成
1、音頻芯片參數介紹
該技術主要通過WiFi/4G模塊與一款音頻解碼芯片(WT2605-24SS)實現,音頻解碼芯片能夠實現語音的更新以及存儲,WT2605-24SS這款音頻解碼芯片的參數如下:
1)帶有DSP指令的32-bit高性能CPU。
2)16 bit DAC音頻解碼器,高達96dB的SNR。
3)支持音頻均衡器調整。
4)1個SPI。
5)1個IR控制器。
6)1個SD卡主機控制器。
7)1個全速USB2.0 HOST/DEVICE 控制器。
8)一個全雙工UART,通訊速率高達1Mbps,主要通過該接口與外部器件進行交互。
?1.1、DAC參數介紹:
DAC對音頻芯片來說是一個很重要的參數,此款芯片具有16bit 的DAC,也就是DAC的轉換精度能夠達到2的16次方,精度越高,音頻播放的還原度也就越高,當然也有24bit DAC的音頻芯片,這類芯片的價格比較高,一般用于高端的消費類電子產品,如HIFI音響等。大部分產品使用16bit的DAC已經足夠,性價比高,當然市面上的音頻芯片DAC特性參差不齊,有9bit,11bit,13bit的DAC,這類語音芯片的解碼通常都依靠軟件解碼的方式去處理,一般音頻文件大部分都是16bit,將16bit的音頻文件通過軟解碼的方式轉為9bit,11bit或13bit的音頻播放,效果可想而知。16bit的DAC直接通過硬件解碼16bit的音頻才能夠達到好的效果。
對于SNR,一般能夠達到90db的信噪比已經有不俗的音質表現,WT2605音頻芯片高達96db的SNR,音質將會表現更加出色。
1.2、音頻格式介紹:
此款芯片主要支持mp3格式,當然也支持WAV,flac,ape等音頻格式播放,一般主要推薦使用mp3格式音頻,這類音頻資源較多,文件容量較小,大部分場景都能夠滿足,比較通用,WAV,flac,ape等都是無損音頻格式,文件容量都比較大,不太適用于語音更新的場景。
1.3、語音合成介紹:
對于提示語音,一般可以通過文字合成語音的方式處理,如下:
?
我們將語音下載下來,用Adobe audition軟件打開音頻看下音頻文件信息:
?可以看到合成出來的是16k,16bit的mp3音頻文件,對于一些應用場景,語音合成直接在服務器端處理即可,這里不做過多介紹。
2、系統框圖介紹:
?
上圖介紹了遠程語音更新的具體實現方式,主要由4G/WiFi設備連接到服務器,通過服務器把音頻數據下發,經過4G/WiFi設備中轉傳輸到WT2605語音芯片組件進行保存,文件由WT2605組件進行統一管理,更新完成后可直接控制設備下發指令進行播放。這樣實現了語音的更新操作,流量也只消耗在音頻數據的傳輸上,相比流媒體播放的方式減少了流量消耗,播放卡頓等現象。
二、電路設計
1、WT2605與WiFi模塊電路

2、上述電路以WiFi模塊作為主控,WiFi模塊獲取服務器端下發的音頻數據,再通過UART串口傳輸到WT2605芯片進行保存,傳輸完成后直接發送相關指令即可控制播放。電路設計非常簡單。

WiFi模塊通過指令,控制WT2605解碼存儲在SPI FLash的音頻數據,經過LM4890功放后播放。這里以1W的功放作為演示,調節R6,R7,R8可調整功放的增益,其他功放根據具體的芯片手冊進行設計。
三、通訊命令格式介紹
通信協議主要定義主控和WT2605之間的交互規則,處理器如何將數據推送給WT2605進行相應的處理,WT2605反饋相應的處理結果。通信數據主要以命令幀的方式進行,一個有效的命令幀必須包含:幀頭,命令包長,命令包,校驗碼,幀尾等五部分。

命令包長表示命令幀除幀頭和幀尾外的字節數,即命令包長(1字節)+命令包(N字節)+校驗碼(1字節)= N+2 字節。幀頭由1個固定的十六進制數據表示,幀類型包含下傳命令幀(模組接收的命令幀)以及上傳命令幀(模組接收數據后反饋的命令幀,即ACK或NAK)。
命令包是具體的命令,主要包含:命令+參數。
校驗碼,為命令包長+命令包的和。

WT2605-24SS語音芯片典型應用場景:
1)寵物喂食器、寵物玩具;
2)掃地機;
3)充電樁;
4)語音廣告機;
5)共享自行車、充電寶等。
唯創知音作為一家專注于語音技術研究的高新技術企業,始終堅持以“服務好工程師”為目標,以行業語音交互器件標準化為方向,致力于讓復雜變簡單,提供快捷的語音、智能物聯網應用解決方案。