欧美日韩亚州综合,国产一区二区三区影视,欧美三级三级三级爽爽爽,久久中文字幕av一区二区不卡

你的位置:首頁 > 測試測量 > 正文

專家親授:基于DSP原理的漢子語音識別系統(tǒng)的實(shí)現(xiàn)

發(fā)布時間:2014-11-04 責(zé)任編輯:echolady

【導(dǎo)讀】語音識別是機(jī)器通過識別理解之后將語音信號轉(zhuǎn)化成文本文件的高科技。這一領(lǐng)域現(xiàn)如今已成為研究的焦點(diǎn),并且在某些領(lǐng)域已取得了突破成就。本文由專家從原理入手,深入解析語音識別系統(tǒng)的實(shí)現(xiàn)過程。

作為專門的研究領(lǐng)域,語音識別又是一門交叉學(xué)科,它與聲學(xué)、語音學(xué)、語言學(xué)、數(shù)字信號處理理論、信息論、計(jì)算機(jī)科學(xué)等眾多學(xué)科緊密相連。本漢語語音識別系統(tǒng)是一個非特定人的、孤立音語音識別系統(tǒng)。其中孤立音至少包括漢語的400多個調(diào)音節(jié)(不考慮聲調(diào))以及一些常用的詞組。識別系統(tǒng)主要用于手持設(shè)備,如手機(jī)、掌上電腦。這些設(shè)備的CPU一般是DSP,硬件資源十分有限,而且大多不支持浮點(diǎn)運(yùn)算。那么,對系統(tǒng)各個部分的設(shè)計(jì)首要考慮的是系統(tǒng)對硬件資源的開銷必須盡量的小,不能超過這些設(shè)備的限制。硬件資源的開銷包括存儲模型參數(shù)的開銷,以及識別過程中對內(nèi)存、DSP的運(yùn)行時間的開銷。

語音識別系統(tǒng)的實(shí)現(xiàn)流程

專家親授:基于DSP原理的漢子語音識別系統(tǒng)的實(shí)現(xiàn)
圖1:語音識別系統(tǒng)處理框圖

在語音識別系統(tǒng)中,模擬的語音信號在完成A/D轉(zhuǎn)換后成為數(shù)字信號,但時域上的語音信號很難直接用于識別,因此需要從語音信號中提取語音的特征,一方面可以獲得語音的本質(zhì)特征,另一方面也起到數(shù)據(jù)壓縮的作用。輸入的模擬語音信號首先要進(jìn)行預(yù)處理,包括預(yù)濾波、采樣和量化、加窗、端點(diǎn)檢測、預(yù)加重等。語音識別系統(tǒng)的模型通常由聲學(xué)模型和語言模型兩部分組成,分別對應(yīng)于語音到半音節(jié)概率的計(jì)算和半音節(jié)到字概率的計(jì)算。

語音識別系統(tǒng)的特征提取

目前通用的特征提取方法是基于語音幀的,即將語音信號分為有重疊的若干幀,對每一幀提取語音特征。由于本技術(shù)方案采用的語音庫采樣率為8 kHz,因此采用幀長為256個采樣點(diǎn)(即32 ms),幀步長或幀移(即每一幀語音與上一幀語音不重疊的長度)為80個采樣點(diǎn)(即10 ms)。

現(xiàn)有語音識別系統(tǒng)采用的最主要的兩種語音特征包括:

線性預(yù)測倒譜參數(shù)(Linear Prediction Cepstrum Coefficient,LPCC),該特征是基于語音信號為自回歸信號的假設(shè),利用線性預(yù)測分析獲得倒譜參數(shù)。LPCC參數(shù)的優(yōu)點(diǎn)是計(jì)算量小,對元音有較好的描述能力,其缺點(diǎn)在于對輔音的描述能力較差,抗噪聲性能較差。

Mel 頻標(biāo)倒譜參數(shù)(Mel Frequency Cepstrum Coefficient,MFCC),該特征考慮了人耳的聽覺特性,將頻譜轉(zhuǎn)化為基于Mel頻標(biāo)的非線性頻譜,然后轉(zhuǎn)換到倒譜域上。由于充分模擬了人的聽覺特性,而且沒有任何前提假設(shè),MFCC參數(shù)具有識別性能和抗噪能力,實(shí)驗(yàn)證明在漢語數(shù)碼語音識別中MFCC 參數(shù)的性能明顯優(yōu)于LPCC參數(shù),因此本技術(shù)方案采用MFCC參數(shù)為語音特征參數(shù)。

求MFCC參數(shù)的大致過程為:

對輸入語音幀加Hamming窗后做快速傅里葉變換(Fast Fourier Transformation,F(xiàn)FT),將時域信號轉(zhuǎn)化為頻域信號。

將線性頻標(biāo)轉(zhuǎn)化為Mel頻標(biāo)。轉(zhuǎn)化方法是將頻域信號通過24個三角濾波器,其中中心頻率在1 000 Hz以上和以下的各12個。濾波器的中心頻率間隔特點(diǎn)是在1000Hz以下為線性分布,1 000 Hz以上為等比數(shù)列分布。三角濾波器的輸出為:
專家親授:基于DSP原理的漢子語音識別系統(tǒng)的實(shí)現(xiàn)
式中:Xk為頻譜上第k個頻譜點(diǎn)的能量;Yi為第i個濾波器的輸出;Fi為第i個濾波器的中心頻率。
用離散余弦變換(Discrete Cosine Transformation,DCT)將濾波器輸出變換到倒譜域:
專家親授:基于DSP原理的漢子語音識別系統(tǒng)的實(shí)現(xiàn)
式中:p為MFCC參數(shù)的階數(shù),這里取p = 12。{Ck}k = 1,2,…,12即為所求的MFCC參數(shù)。
為體現(xiàn)語音的動態(tài)特性,在語音特征中加入了一階差分倒譜,其計(jì)算方法如下式所示:
專家親授:基于DSP原理的漢子語音識別系統(tǒng)的實(shí)現(xiàn)
式中下標(biāo)l與l - k表示第l與l - k幀;m表示第m維。
[page]
MFCC參數(shù)計(jì)算的要點(diǎn)是將線性功率譜S(n)轉(zhuǎn)換成為Mel頻率下的功率譜,這需要在計(jì)算之前先在語音的頻譜范圍內(nèi)設(shè)置若干個帶通濾波器Hm(n),m= 0,1,2,…,M - 1,n = 0,1,2,…,N/2 - 1。M為濾波器個數(shù),N為一幀語音信號的點(diǎn)數(shù)。每個濾波器具有三角形特性,其中心頻率為fm,它們在Mel頻率軸上是均勻分布的。在線性頻率上,當(dāng)m 較小時相鄰的fm間隔很小,隨著m的增加相鄰的fm間隔逐漸拉開。Mel頻率和線性頻率的轉(zhuǎn)換關(guān)系如下:
專家親授:基于DSP原理的漢子語音識別系統(tǒng)的實(shí)現(xiàn)
這些帶通濾波器的參數(shù)是事先計(jì)算好的。圖2給出了濾波器組的分布圖,其中M 選擇為26,F(xiàn)FT點(diǎn)數(shù)N為256,語音信號的采樣頻率為8000 Hz。

專家親授:基于DSP原理的漢子語音識別系統(tǒng)的實(shí)現(xiàn)
圖2:利用人耳仿生學(xué)特性設(shè)計(jì)的Mel尺度濾波器組
 
系統(tǒng)測度估計(jì)

測度估計(jì)技術(shù)可以采用動態(tài)時間彎折DTW、隱馬爾可夫模型HMM或人工神經(jīng)網(wǎng)ANN等算法,本項(xiàng)目采用國際上最先進(jìn)的HMM,這樣能夠比較容易的實(shí)現(xiàn)非特定人,而且系統(tǒng)結(jié)構(gòu)也比較靈活、一致。

根據(jù)描述的語音單位的大小,HMM可分為:基于整詞模型的HMM(Word based HMM)。其優(yōu)點(diǎn)為可以很好地描述詞內(nèi)音素協(xié)同發(fā)音的特點(diǎn),建模過程也較為簡單。因此很多小詞匯量語音識別系統(tǒng)均采用整詞模型HMM。但在大詞匯量語音識別中由于所需建立的模型太多而無法使用。

基于子詞模型的HMM(Sub Word based HMM)。該類HMM描述的語音單位比詞小,如英語語音識別中的基本音素,漢語語音識別中的半音節(jié)等。其優(yōu)點(diǎn)為模型總數(shù)少,所以在大詞匯量語音識別中得到了廣泛的應(yīng)用。其缺點(diǎn)在于其描述詞內(nèi)協(xié)同發(fā)音的能力劣于整詞模型,但由于子詞模型已經(jīng)得到了非常充分的研究,所以近年來在很多小詞表應(yīng)用識別系統(tǒng)中也用了子詞模型。本技術(shù)方案采用基于半音節(jié)(即聲、韻母)的語音建模方法,其識別模型拓?fù)浣Y(jié)構(gòu)如圖3 所示,其中靜音HMM采用1個狀態(tài),每一聲母模型采用2個狀態(tài),每一韻母模型采用4個狀態(tài)。

專家親授:基于DSP原理的漢子語音識別系統(tǒng)的實(shí)現(xiàn)
圖3:語音模型拓?fù)浣Y(jié)構(gòu)
 
根據(jù)輸出概率分布的不同,HMM(隱含馬爾科夫模型)可分為:

離散HMM(Discrete HMM,DHMM)。其輸出概率是基于一套碼本的離散概率分布,其優(yōu)點(diǎn)在于由于實(shí)現(xiàn)了存儲量和計(jì)算量都較小,所需的訓(xùn)練語音也較少,但其矢量量化的過程會造成性能的損失。

連續(xù)HMM(Continuous Density HMM,CDHMM)。其輸出概率是連續(xù)概率密度函數(shù)(一般是高斯混合密度函數(shù))。其所需的訓(xùn)練語音較多,模型參數(shù)存儲量和計(jì)算量都較大,在訓(xùn)練語音足夠時,其性能優(yōu)于DHMM。

半連續(xù)HMM(Semi Continuous HMM,SCHMM)。SCHMM是DHMM和CDHMM的折衷,與DHMM相似,其輸出為一套碼本,但每個碼字均為一個連續(xù)概率密度分布函數(shù),這一點(diǎn)與CDHMM相近。其性能和所需的訓(xùn)練語音等均介于DHMM和CDHMM之間。

考慮到漢語數(shù)碼語音所需的模型較少,很容易獲得足夠多的訓(xùn)練語音,因此本技術(shù)方案采用了CDHMM為語音模型。
狀態(tài)輸出概率分布為混合高斯密度函數(shù)。其各分量計(jì)算如下:
專家親授:基于DSP原理的漢子語音識別系統(tǒng)的實(shí)現(xiàn)
總的概率輸出即為各分量的加權(quán)和:
專家親授:基于DSP原理的漢子語音識別系統(tǒng)的實(shí)現(xiàn)
式中:s表示當(dāng)前狀態(tài);M為混合分量數(shù);u,Σ ,c分別為各混合分量的均值矢量、協(xié)方差矩陣和混合分量系數(shù)。

該算法利用Viterbi譯碼的過程進(jìn)行幀同步的搜索,易于實(shí)時實(shí)現(xiàn),也容易納入語法信息。考慮到系統(tǒng)的實(shí)時實(shí)現(xiàn)性,本技術(shù)方案采用Viterbi譯碼作為系統(tǒng)的搜索算法。

系統(tǒng)試驗(yàn)結(jié)果

在漢語全音節(jié)與詞組混合的語音識別任務(wù)中,得到的初步實(shí)驗(yàn)結(jié)果為:PC微機(jī)浮點(diǎn)算法條件下正確覆蓋率不低于98%,定點(diǎn)算法的正確覆蓋率不低于97%。DSP嵌入系統(tǒng)定點(diǎn)條件下正確覆蓋率不低于96%。系統(tǒng)的響應(yīng)時間滿足實(shí)時識別的要求。通過測試組嚴(yán)格的檢查及抽樣測試,證明上述結(jié)果真實(shí)可靠,該輸入法基本達(dá)到實(shí)用化要求。

總結(jié)

漢字語音識別是科技領(lǐng)域的重要課題,本文介紹的方案設(shè)計(jì)采用孤立語音的全音階和詞組的混合識別模式,使用連續(xù)概率分布非特定人的聲學(xué)模型,并輔以多候選的人機(jī)交互方式,漢子語音的輸入。相信未來在語音識別的方向上還會取得更大的突破。

相關(guān)閱讀:

技術(shù)達(dá)人:ARM的非特定人語音識別系統(tǒng)的設(shè)計(jì)
智能手機(jī)的超性能語音識別技術(shù)
技術(shù)分享:基于DSP和OZ890的電池管理系統(tǒng)電路設(shè)計(jì)

要采購濾波器么,點(diǎn)這里了解一下價格!
特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
?

關(guān)閉

?

關(guān)閉

欧美日韩亚州综合,国产一区二区三区影视,欧美三级三级三级爽爽爽,久久中文字幕av一区二区不卡
欧美日韩一区中文字幕| 亚洲国产aⅴ成人精品无吗| 欧美一卡在线观看| 亚洲精品一区二区精华| 久久精品亚洲麻豆av一区二区| 国产精品日韩成人| 一区二区三区在线免费播放| 日韩电影网1区2区| 91在线视频在线| 日韩一级片在线播放| 日韩美女啊v在线免费观看| 奇米四色…亚洲| 欧美日韩国产成人在线91| 国产亚洲一二三区| 免费观看一级欧美片| 在线视频你懂得一区二区三区| 久久天天做天天爱综合色| 午夜精品影院在线观看| 欧美这里有精品| 亚洲精品v日韩精品| 91美女视频网站| 337p日本欧洲亚洲大胆色噜噜| 亚洲一二三四在线观看| 不卡电影一区二区三区| 国产午夜精品理论片a级大结局| 日韩电影在线观看一区| 欧美日韩亚州综合| 一区二区三区免费观看| 色婷婷综合激情| 亚洲综合一区二区精品导航| 日本道色综合久久| 一区二区三区免费看视频| 91网站在线播放| 亚洲午夜一区二区| 欧美视频你懂的| 日本不卡视频一二三区| 久久先锋影音av| 99视频一区二区三区| 亚洲高清免费在线| 久久久777精品电影网影网| 国产成人午夜精品影院观看视频| 中文字幕中文在线不卡住| 本田岬高潮一区二区三区| 一区二区三区国产精华| 欧美va天堂va视频va在线| 暴力调教一区二区三区| 蜜臂av日日欢夜夜爽一区| 久久久久久久久久久99999| 91看片淫黄大片一级在线观看| 蜜臀久久99精品久久久久宅男| 中文字幕精品一区二区精品绿巨人| 欧美三级韩国三级日本一级| 国产精品99久久不卡二区| 亚洲综合色噜噜狠狠| 国产精品第四页| 国产精品性做久久久久久| 久久99国产精品尤物| 成人av动漫在线| 国产精品 日产精品 欧美精品| 中文欧美字幕免费| xnxx国产精品| 欧美性生交片4| 成人午夜电影久久影院| 日韩国产精品久久久| 亚洲日本va午夜在线影院| 日韩视频在线你懂得| 日韩欧美中文字幕制服| 在线不卡a资源高清| 欧美日韩中文字幕精品| 欧美变态tickle挠乳网站| 欧美疯狂性受xxxxx喷水图片| 欧洲一区二区三区免费视频| 色综合久久久久综合体| 成人黄动漫网站免费app| 白白色 亚洲乱淫| 色欲综合视频天天天| 在线观看一区不卡| 欧美videossexotv100| ...xxx性欧美| 亚洲一区二区欧美| 成人av午夜电影| 久久人人97超碰com| 久久狠狠亚洲综合| 制服丝袜一区二区三区| 国产精品久久久久婷婷| 亚洲福利视频一区| yourporn久久国产精品| 欧美日韩国产高清一区| 综合欧美亚洲日本| 国产一区二区电影| 精品免费视频一区二区| 亚洲国产精品视频| 欧美午夜精品久久久久久孕妇| 久久免费的精品国产v∧| 亚洲成人1区2区| 一本色道**综合亚洲精品蜜桃冫| 精品国产一区久久| 精品一区二区久久| 久久久国产综合精品女国产盗摄| 日韩高清不卡一区二区三区| 欧美视频在线观看一区| 亚洲成人第一页| 4438x亚洲最大成人网| 无吗不卡中文字幕| 日韩一区二区三区三四区视频在线观看 | 亚洲国产精品一区二区www在线| 美女视频黄a大片欧美| 在线电影欧美成精品| 日韩精品一二区| 日韩手机在线导航| 国产精品一区二区久久精品爱涩| 久久久久久9999| 成人黄色av电影| 日韩福利电影在线| 久久久久久免费毛片精品| 国产精品 日产精品 欧美精品| 亚洲欧美在线观看| 99久久久无码国产精品| 一区二区三区不卡视频在线观看| 91黄色免费网站| 国产a久久麻豆| 午夜亚洲国产au精品一区二区| 欧美成人官网二区| 91久久久免费一区二区| 国产在线精品免费| 青青草精品视频| 亚洲精品写真福利| 欧美日韩国产一级二级| 日韩综合在线视频| 夜夜精品浪潮av一区二区三区| 久久综合九色综合欧美就去吻| 欧美日韩一区在线| 色哟哟在线观看一区二区三区| 国产精品自拍av| 韩国一区二区三区| 国产综合久久久久影院| 国内精品自线一区二区三区视频| 日韩精品一区二区三区老鸭窝| 国产老妇另类xxxxx| 国产日韩欧美精品综合| 中文字幕一区二区三区四区不卡 | 国产美女久久久久| 国产成人av电影| 91视频国产资源| av爱爱亚洲一区| 欧美午夜电影一区| 精品日韩99亚洲| 日韩欧美电影在线| 日韩一区在线播放| 爽好多水快深点欧美视频| 蜜桃视频在线一区| bt欧美亚洲午夜电影天堂| 精品国产伦一区二区三区观看体验| 久久午夜羞羞影院免费观看| 性久久久久久久| 91免费观看在线| 中文字幕制服丝袜成人av| 亚洲人亚洲人成电影网站色| 韩国精品一区二区| 日本韩国欧美三级| 亚洲伦在线观看| 激情欧美日韩一区二区| 欧美肥妇毛茸茸| 一卡二卡欧美日韩| 91视频免费看| 国产免费观看久久| 国内精品伊人久久久久av影院| 色婷婷av一区二区三区大白胸| 国产精品电影一区二区三区| 91视频国产观看| 日本中文一区二区三区| 久久久不卡网国产精品二区| 国产伦精一区二区三区| 亚洲欧美综合另类在线卡通| 悠悠色在线精品| 99国产精品久久| 精品日韩一区二区三区免费视频| 一级特黄大欧美久久久| 成人中文字幕在线| 国产精品国产自产拍高清av王其| 国产曰批免费观看久久久| 欧美一区二区三区在线观看 | 国产一区二区三区黄视频| 欧美日韩国产一区| 国产一区二区三区观看| 欧美不卡一区二区三区四区| 美女www一区二区| 久久精品无码一区二区三区| 成人免费视频一区| 亚洲一区欧美一区| 91精品国产综合久久小美女| 日本aⅴ免费视频一区二区三区 | 美女视频一区二区| 国产精品网站在线观看| 欧美午夜精品免费| 国产精品18久久久久久久久| 亚洲欧美电影院| 久久精品日产第一区二区三区高清版 | 国产综合久久久久久鬼色| 国产精品高清亚洲|