- 相關(guān)推薦
SPCE061A在語(yǔ)音遙控器中的應用
凌陽(yáng)科技公司的最新產(chǎn)品SPCE061A,不但具有微控制器的功能,還具有DSP運算功能,可以用來(lái)進(jìn)行數字語(yǔ)音(音樂(lè ))信號處理。根據此特點(diǎn),我們設計了一款語(yǔ)音遙控器,她可以語(yǔ)音識別常用電臺及控制命令,如“開(kāi)機”、“關(guān)機”、“頻道增加”、“頻道減少”等遙控功能命令及“中央一臺”、“北京二臺”等電臺命令功能,對于這些電臺,用戶(hù)可以“直呼其名”切換到相應電臺,不用每次搜索而煩惱;也方便用戶(hù)在晚上光線(xiàn)較暗的情況下的使用;更是視力較差、盲人的福音。
我們還加入了溫度采集、語(yǔ)音報溫的功能,通過(guò)按鍵控制,她采集當前溫度,并用優(yōu)美的聲音播報“當前溫度是xx攝氏度”。
在不增加成本的情況下,給語(yǔ)音遙控器加入了萬(wàn)年歷計算、語(yǔ)音報時(shí)功能,通過(guò)按鍵,她會(huì )播報“xxxx年xx月xx日”或“上午(下午、晚上)x點(diǎn)x分”。
1 系統組成
目前所設計的空調語(yǔ)音遙控器,主要由鍵盤(pán)輸入、MIC輸入、溫度采集、語(yǔ)音輸出、紅外發(fā)射電路組成。按鍵用來(lái)完成按鍵遙控功能------保留按鍵功能、語(yǔ)音報溫、報時(shí); SPCE061A有一路專(zhuān)用于語(yǔ)音信號采集的A/D轉換電路(MIC輸入),可以用來(lái)進(jìn)行語(yǔ)音識別、錄音等的語(yǔ)音信號輸入,本遙控器用來(lái)采集語(yǔ)音信號,進(jìn)行語(yǔ)音識別;SPCE061A有7路A/D,選其中1路進(jìn)行溫度采集,由按鍵控制溫度播報;SPCE061A有豐富的時(shí)基信號,采用2Hz進(jìn)行計數,并進(jìn)行萬(wàn)年歷計算,由按鍵控制播報時(shí)間。系統組成如圖1所示。
2 硬件組成
硬件電路如圖2所示:
共設計了13個(gè)按鍵,采用4×4的行列式鍵盤(pán)輸入,IOA0---IOA3設置成輸入口,IOA8---IOA11設置成輸出口,預留3個(gè)按鍵作為備用。
語(yǔ)音識別的硬件電路比較簡(jiǎn)單,MIC選用駐極體話(huà)筒,駐極體話(huà)筒具有結構簡(jiǎn)單、重量輕、體積小、無(wú)方向性、頻率響應寬、保真度好等優(yōu)點(diǎn)。駐極體話(huà)筒的偏壓由SPCE500A的VMIC腳提供。
SPCE061A提供雙通道10位D/A輸出AUD1、AUD2,其中每個(gè)DAC通道的輸出能力為3mA,用于輸出語(yǔ)音信號,考慮功耗問(wèn)題,采用單通道AUD1輸出。
利用SPCE061A的IOB8輸出的PWM信號(IOB8、IOB9口的特殊功能)可以作為紅外載波信號,載波頻率由可編程定時(shí)器TimerA(或TimerB)的溢出頻率決定。本遙控器用IOB8產(chǎn)生紅外載波信號。
溫度傳感器采用普通負溫度系數熱敏電阻,熱敏電阻靈敏度高、價(jià)格便宜。('nSP(tm)內核是一個(gè)通用的核結構。除此之外的其它功能模塊均為可選結構,亦即這種結構可大可小或可有可無(wú)。借助這種通用結構附加可選結構的積木式的構成,便可形成各種不同系列派生產(chǎn)品,以適合不同的應用場(chǎng)合。這樣做無(wú)疑會(huì )使每一種派生產(chǎn)品具有更強的功能和更低的成本。
3 軟件設計
軟件采用模塊化程序結構,程序模塊包括初始化、鍵盤(pán)掃描、溫度采集、溫度播報、萬(wàn)年歷時(shí)間計算、萬(wàn)年歷播報、紅外發(fā)射、語(yǔ)音識別、語(yǔ)音播放模塊等,程序流程見(jiàn)圖3所示:
圖3 流程圖
系統初始化包括系統時(shí)鐘、IO口、萬(wàn)年歷初始值、中斷(打開(kāi)按鍵喚醒和2Hz中斷),然后掃描按鍵,有按鍵進(jìn)行相應處理,無(wú)按鍵進(jìn)入睡眠,萬(wàn)年歷計算在2Hz中斷服務(wù)程序中進(jìn)行。
語(yǔ)音播放采用凌陽(yáng)科技公司提供的音頻編碼算法,先在PC機上錄好提示語(yǔ)音文件(WAV文件),并經(jīng)凌陽(yáng)公司提供的壓縮工具壓縮處理成二進(jìn)制文件加載到用戶(hù)程序,編譯鏈接后存儲到單片機FLASH中,播放時(shí)再解壓縮送D/A還原出語(yǔ)音。用于u'nSPTM內核的SPCE系列芯片,凌陽(yáng)科技公司提供三種不同壓縮率的算法,下表是各種壓縮算法名稱(chēng)及編碼率類(lèi)型。
壓縮算法名稱(chēng)語(yǔ)音壓縮編碼率類(lèi)型
SACM_A200016KBits/s、20KBits/s、24KBits/sSACM_S4804.8KBits/s、7.2KBits/sSACM_S2402.4KBits/s這三種壓縮算法的區別在于壓縮率不同、音質(zhì)也不同。SACM_A2000壓縮率相對較小,音質(zhì)較好,相應的資源占用較多。SACM_S240的壓縮率最大,音質(zhì)相對較差。SACM_S480介于這兩者之間。每種算法都有完整的庫函數供程序調用,軟件編寫(xiě)非常方便。本語(yǔ)音遙控器采用SACM_S480算法。
語(yǔ)音識別分為特定發(fā)音人識別(Speaker Dependent)和非特定發(fā)音人識別(Speaker Independent)兩種方式。
特定發(fā)音人識別是指語(yǔ)音樣板由單個(gè)人訓練,對訓練人的語(yǔ)音命令識別準確率較高,而其他人的語(yǔ)音命令識別準確率較低或不識別。非特定發(fā)音人識別是指語(yǔ)音樣板由不同年齡、不同性別、不同口音的人進(jìn)行訓練,可以識別一群人的命令。語(yǔ)音樣板的提取非常重要。語(yǔ)音遙控器就是采用非特定發(fā)音人識別方式。
語(yǔ)音識別分為語(yǔ)音樣板訓練和語(yǔ)音識別兩個(gè)過(guò)程。我們將標準模式的存儲空間稱(chēng)之為“詞庫”,而把標準模式稱(chēng)之為“樣板”。所謂語(yǔ)音樣板訓練,就是將待識別的命令進(jìn)行頻譜分析,提取特征參數作為識別的標準模式。語(yǔ)音識別的過(guò)程就是提取語(yǔ)音命令的
【SPCE061A在語(yǔ)音遙控器中的應用】相關(guān)文章:
ISD4004語(yǔ)音芯片在語(yǔ)音報站器中的應用03-19
語(yǔ)音處理芯片AC48105在低速語(yǔ)音編碼設備中的應用03-18
藍牙芯片ROK 101 007在語(yǔ)音系統中的應用03-27
基于HMM的語(yǔ)音識別技術(shù)在嵌入式系統中的應用03-18