基于嵌入式系統(tǒng)的語音口令識別系統(tǒng)的實現(xiàn)

                  2013-09-23 14:45 來源:互聯(lián)網(wǎng) 作者:洛小辰

                  0 引言

                  隨著計算機(jī)技術(shù)和信息技術(shù)的迅速發(fā)展,語音口令識別已經(jīng)成為了人機(jī)交互的一個重要方式之一。語音口令識別系統(tǒng)將根據(jù)人發(fā)出的聲音、音節(jié)或短語給出響應(yīng),如通過語音口令控制一些執(zhí)行機(jī)構(gòu)、控制家用電器的運行或做出回答等。在數(shù)字信號處理芯片上已經(jīng)實現(xiàn)了語音口令識別系統(tǒng)或語音口令識別系統(tǒng)的部分功能,然而隨著嵌入式微處理器處理能力的大幅度提高,計算量大的語音口令識別算法已經(jīng)能夠通過嵌入式微處理器來完成,將語音口令識別系統(tǒng)與嵌入式系統(tǒng)相結(jié)合,發(fā)揮語音識別系統(tǒng)的潛力,使語音識別系統(tǒng)能夠廣泛應(yīng)用于便攜式設(shè)備中。

                  采用隱馬爾克夫模型(Hidden Markov MODEL,HMM) 描述語音信號的非平穩(wěn)性和局部平穩(wěn)性,HMM中的狀態(tài)與語音信號的某個平穩(wěn)段相對應(yīng),平穩(wěn)段之間以轉(zhuǎn)移概率相聯(lián)系。由于HMM建模對語音信號長度和模型的混合度的要求都比較低,因此在現(xiàn)有的非特定人語音口令識別系統(tǒng)中,多采用狀態(tài)輸出具有連續(xù)概率分布的連續(xù)隱馬爾可夫模型(ConTInuous Density Hidden Markov MODEL,CDHMM)。

                  論文給出一種基于嵌入式系統(tǒng)的語音口令識別系統(tǒng)的設(shè)計方案,硬件系統(tǒng)的核心芯片是嵌入式微處理器,語音口令識別算法采用CDHMM。語音口令首先經(jīng)過預(yù)處理,提取MFCC(Mel-Frequency Ceptral Coefficients)特征參數(shù),然后建立此口令的CDHMM模型,把所有語音口令的模型放在模型庫中,在識別階段,通過概率輸出*分,取*分最大的一個作為識別出的口令。將語音識別系統(tǒng)與嵌入式系統(tǒng)相結(jié)合,可以使語音口令識別系統(tǒng)廣泛應(yīng)用于便攜式設(shè)備中。

                  1 硬件電路的設(shè)計和工作原理

                  基于嵌入式系統(tǒng)的語音口令識別系統(tǒng)需要有接收語音信號的輸入芯片配合麥克風(fēng)實現(xiàn)將模擬語音信號轉(zhuǎn)換成數(shù)字信號的功能,然后由嵌入式微處理器對輸入的語音口令信號進(jìn)行處理。完成語音口令信號輸入功能的芯片采用的是PHILIPS公司的低功耗芯片UDAl341TS,供電電源電壓為3V,該音頻處理芯片由模數(shù)/數(shù)模轉(zhuǎn)換(ADC)、控制邏輯電路、可編程增益放大器(PGA)和數(shù)字自動增益控制器(DAGC)以及數(shù)字信號處理器等部分組成,能進(jìn)行數(shù)字語音處理。

                  芯片UDAl341TS采用標(biāo)準(zhǔn)的內(nèi)部集成電路聲音總線IIS(Inter IC Sound Bus),該總線是由PHILIPS等公司共同提出的數(shù)字音頻總線協(xié)議,專門用于音頻設(shè)備之間的數(shù)據(jù)傳輸,目前很多音頻芯片和微處理器都提供了對IIS總線的支持。

                  IIS總線有三根信號線,分別是位時鐘信號BCK(Bit Clock)、字選擇控制信號WS(Word Select)和串行數(shù)據(jù)信號Data,由主設(shè)備提供串行時鐘信號和字選擇控制信號,IIS總線的時序如圖1所示。

                  IIS總線的時序

                  WS也稱為幀時鐘信號,該信號的電平為低電平時,傳輸?shù)妮斎胍纛l數(shù)據(jù)信號是左聲道的音頻數(shù)據(jù)信號;信號WS的電平為高電平時,傳輸?shù)妮斎胍纛l數(shù)據(jù)信號是右聲道的音頻數(shù)據(jù)信號。BCK對應(yīng)著輸入音頻數(shù)據(jù)信號的每一位音頻數(shù)據(jù),其頻率為2×采樣頻率×每個采樣值的位數(shù)。

                  與BCK同步的串行音頻數(shù)據(jù)信號采用補(bǔ)碼的形式傳輸,傳輸順序是高位先傳輸。IIS總線格式的信號無論有多少位有效數(shù)據(jù),數(shù)據(jù)的最高位MSB總是出現(xiàn)在WS信號改變(也就是傳輸一幀數(shù)據(jù)信號開始)后的第2個串行數(shù)據(jù)信號SCLK脈沖位置。

                  通過上述IIS總線能夠得到輸入的音頻數(shù)據(jù)信號,而其它的信號如自動增益控制、輸入數(shù)據(jù)格式的選擇和輸入增益的控制等控制信號通過稱為“L3” 形式的接口總線傳輸。為了減少引腳數(shù)和保持連線簡單,該接口總線采用串行數(shù)據(jù)傳輸方式,接口總線由3條信號線組成:時分復(fù)用的數(shù)據(jù)通道線L3DATA、模式控制線L3MODE和時鐘信號線L3CLOCK。模式控制線L3MODE為低電平時的傳輸模式為地址傳輸模式;為高電平時的傳輸模式為數(shù)據(jù)傳輸模式。

                  語音口令識別系統(tǒng)的硬件電路的核心芯片是嵌入式微處理器Samsung S3C2440 AL,主頻為400MHz。三星公司推出的RISC微處理器S3C2440 AL具有低功耗、高性能等特點,可以廣泛應(yīng)用于便攜式設(shè)備中。S3C2440AL具有一個IIS總線音頻編碼/解碼接口,語音口令識別系統(tǒng)的硬件電路如圖 2所示。其IIS總線控制器通過5根信號線與UDAl34lTS編解碼芯片相連。這些5根信號線分別是:系統(tǒng)時鐘信號CDCLK:位時鐘信號I2- SSCLK;字選擇控制信號I2SLRCK;串行數(shù)據(jù)輸入信號I2SSDI;串行數(shù)據(jù)輸出信號I2SDO。S3C2440 AL使用L3接口傳輸其他(如自動增益控制、輸入數(shù)據(jù)格式的選擇和輸入增益的控制等)控制信號。為了使系統(tǒng)間能夠更好地同步,S3C2440AL需要向芯片UDAl341TS提供CDCLK,該時鐘信號的頻率可以選擇采樣頻率的256倍、384倍或512倍。

                  語音口令識別系統(tǒng)的硬件電路

                  2 基于CDHMM的口令識別的軟件設(shè)計

                  1 2 > 
                  嵌入式系統(tǒng) 語音口令識別 隱馬爾克大模型

                  相關(guān)閱讀

                  暫無數(shù)據(jù)

                  一周熱門

                  久久久久亚洲av成人无码电影| 亚洲一区二区三区四区视频| 亚洲综合av永久无码精品一区二区| 久久亚洲精品国产精品黑人| 久久精品亚洲福利| 在线播放亚洲精品| 久久亚洲精品11p| 亚洲国产成人无码AV在线影院 | 亚洲乱码日产精品BD在线观看| 亚洲国产成人久久精品动漫| 久久精品国产亚洲av麻| 国产亚洲一区二区三区在线观看 | 亚洲明星合成图综合区在线| 亚洲一区二区三区高清| 亚洲国产精品久久久久| 亚洲日韩图片专区第1页| 亚洲一级二级三级不卡| 在线免费观看亚洲| 亚洲婷婷在线视频| 亚洲一级大黄大色毛片| 亚洲欧洲日本在线观看| 亚洲欧洲av综合色无码| 欧美日韩亚洲精品| 亚洲国产精品一区二区第四页| 亚洲区小说区图片区| 久久久亚洲精品蜜桃臀| 国产亚洲A∨片在线观看| 亚洲爆乳精品无码一区二区三区 | 亚洲AV无码国产精品色午友在线 | 亚洲精品无码日韩国产不卡av| 亚洲精品无码久久久久A片苍井空| 亚洲精品无码中文久久字幕| 激情小说亚洲图片| 亚洲一区视频在线播放 | 激情综合色五月丁香六月亚洲| 亚洲色成人网站WWW永久| 亚洲精品在线观看视频| 亚洲性色高清完整版在线观看| 国产亚洲精品bv在线观看| 亚洲aⅴ无码专区在线观看春色| 亚洲国产精品13p|