- 相關(guān)推薦
基于DSP的聲控電子記事本的設計與實(shí)現
摘要:一種基于DSP芯片的語(yǔ)音識別和數字錄音系統。在該系統中,DSP(單片ADSP2185)完成語(yǔ)音識別和數字錄音功能,MCU完成用戶(hù)界面處理。該系統可以實(shí)現語(yǔ)音名片(電路號碼、工作單位、地址等)存儲及聲控查詢(xún)、記事錄音及聲控回放、日歷、簡(jiǎn)單計算器等功能。語(yǔ)音識別及語(yǔ)音編解碼技術(shù)經(jīng)過(guò)幾十年的發(fā)展,已經(jīng)日趨成熟,步入實(shí)用化階段。語(yǔ)音識別技術(shù)已開(kāi)始應用于電話(huà)查詢(xún)服務(wù)、智能玩具、PDA、家用電器、通信、工業(yè)控制、語(yǔ)言學(xué)習等應用領(lǐng)域;其于碼激勵線(xiàn)性預測(CELP)技術(shù)的語(yǔ)音編解碼算法也因其音質(zhì)好,壓縮比大而在通信和數字錄音設備中獲得了廣泛應用。
語(yǔ)音輸入方式與手寫(xiě)輸入方式相比,具有操作簡(jiǎn)便、查找方便、識別準確率高等優(yōu)點(diǎn)。省去了大量的輸入時(shí)間,降低了信息檢索的復雜度。本文所介紹的聲控電子記事本系統將語(yǔ)音識別和語(yǔ)音編解碼在同一片DSP芯片上實(shí)現,用語(yǔ)音方式代替其它方式進(jìn)行信息輸入,提高了系統的靈活性。
1 系統功能
·可存200張語(yǔ)音名片,每張語(yǔ)音名片包含四條信息:姓名、電話(huà)號碼、工作單位、備注;聲控查找語(yǔ)音名片信息,用戶(hù)只需口述所要查找人的姓名,即可獲得電話(huà)號碼、工作單位、備注等信息,同時(shí)電話(huà)號碼顯示在液晶顯示屏上。
·具有雙音多頻(DTMF)撥號功能,用戶(hù)用聲控查找到電話(huà)號碼并顯示在液晶屏上之后,只需輕觸一個(gè)撥號鍵,即可通過(guò)普通電話(huà)機的話(huà)筒實(shí)現快速自動(dòng)撥號。
·數字錄音,每段錄音加語(yǔ)音標識;聲控放音,在放音時(shí)只需口述所要語(yǔ)音段的語(yǔ)音標識即可自動(dòng)找到該段錄音并加放,累計錄音時(shí)間達兩個(gè)半小時(shí)以上。
·具有方便的編輯功能,增加、刪除語(yǔ)音名片,增加、刪除數字錄音段。
2 系統構成
本文所介紹的聲控電子記事本系統,是在定點(diǎn)16位DSP芯片上實(shí)現的,它包含特定人孤立詞語(yǔ)音識別算法和代數碼本激勵線(xiàn)性預測(ACELP)語(yǔ)音編解碼算法數(MFCC)為語(yǔ)音特征、以動(dòng)態(tài)時(shí)間規劃(DTW)為模板匹配算法,對于普通詞條,識別率達到了99%以上。用于“錄音”功能的ACELP算法是該碼率下性能優(yōu)異的編解碼算法,雖然算法復雜度較高,但共重建語(yǔ)音質(zhì)量的平均主觀(guān)評測分數(MOS分)達到了4.0,非常接近于壓縮前的分數4.3。
如圖1所示,系統由MCU實(shí)現總線(xiàn)控制,接受外部鍵盤(pán)輸入,并在液晶屏上顯示信息。在本系統中,語(yǔ)音充當大部分人機界面的角色,盡量省去復雜的鍵盤(pán)操作,而且用語(yǔ)音提示或語(yǔ)音回放代替一部門(mén)液晶文字提示。由于語(yǔ)音要經(jīng)過(guò)DSP處理,所以MCU需要與DSP經(jīng)常交換信息,以便實(shí)現友好的操作界面。
2.1 DSP
DSP(ADSP2185)是整個(gè)硬件系統的信號處理中心,完成語(yǔ)音識別、訓練、編解碼,進(jìn)行片內RAM及外部FLASH存儲芯片的數據管理與調度,并向主控芯片MCU提供簡(jiǎn)潔的命令與反饋信息。ADSP2185是Analog Devices公司的產(chǎn)品,其主要性能如下:
·運算速度為50MIPS,且均為高效的單周期指令。
·提供了80Kbyte的片內RAM,其中32Kbyte為數據RAM,48Kbyte為程序RAM。
·最大可支持4Mbyte的外部存儲區,用于存儲數據或程序。
·提供對字節存儲區(BM)與片內RAM區之間的DMA方式支持。
·提供兩上可編程、全雙工、自動(dòng)進(jìn)行收發(fā)緩沖區操作的串行口。
2.2 MCU
MCU(KS57C2316)是SAMSUNG公司生產(chǎn)的性?xún)r(jià)比較高的一種CMOS四位單片機,可以一次性編程,適于小批量生產(chǎn),被廣泛地應用于家用電器的控制,它具有強大的I/O功能。其主要性能如下:
·ROM為16K×8 bit;RAM為512×4 bit
·40個(gè)I/O引腳
·多至16位數字LCD顯示
——32個(gè)段,4個(gè)公共端引腳
這些性能保證了系統主控能力,而且能夠提供靈活的外部接口,適于做進(jìn)一步的改進(jìn)和改造。計算器等附加功能可以直接由MCU完成。
2.3 數據FLASH存儲器
數據FLASH存儲器KM29U64000是SAMSUNG公司的產(chǎn)品,它可在3伏電壓下低功耗工作,存貯量大、價(jià)位低、速度快、存儲數據掉電后可保持而不會(huì )丟失。其主要性能指標如下:
·存儲單元陣列為(8M 256K)×8bit;數據寄存器(512 16)×8bit
·頁(yè)寫(xiě)入為(512 16)Byte;塊擦除為(8K 256)Byte
·命令/地址/數據復用I/O端口
·可靠的CMOS Floating-Gate技術(shù),耐受一百萬(wàn)次寫(xiě)入/擦除,數據維持時(shí)間為10年
·命令寄存器操作
【基于DSP的聲控電子記事本的設計與實(shí)現】相關(guān)文章:
基于DSP的擴頻電臺基帶模塊的設計與實(shí)現03-18
基于A(yíng)DI TigerSHARC DSP的OFDM收發(fā)信機的設計與實(shí)現03-30
基于USB與DSP的指紋識別系統的設計實(shí)現03-19
DNP3.0在基于DSP的FTU中的實(shí)現03-18
基于DSP的智能座椅系統的設計03-07
基于ESMTP的電子郵件發(fā)送程序的設計與實(shí)現11-16
基于幀的實(shí)時(shí)話(huà)音變換技術(shù)與DSP實(shí)現03-07
基于DSP的語(yǔ)音處理系統的設計11-22