創(chuàng)澤機(jī)器人
CHUANGZE ROBOT
當(dāng)前位置:首頁(yè) > > 新聞資訊 > 機(jī)器人語(yǔ)音識(shí)別主要模式:頻譜圖法,LPC法,隱藏式馬可

機(jī)器人語(yǔ)音識(shí)別主要模式:頻譜圖法,LPC法,隱藏式馬可

來(lái)源:神奇的機(jī)器人     編輯:創(chuàng)澤   時(shí)間:2025/12/29   主題:其他 [加盟]

人的發(fā)聲器官可以分為兩個(gè)部 分,即聲道和聲帶。如果直接讓機(jī)器人理解我們說(shuō)的話,難度比較大,將人類語(yǔ) 言轉(zhuǎn)化為機(jī)器人可以理解識(shí)別的信號(hào),就是一個(gè)很好的途徑。如果將整個(gè)過(guò)程看 為一個(gè)信號(hào)過(guò)程的話,聲帶是發(fā)生源,聲道相當(dāng)于一個(gè)諧振時(shí)的聲帶振動(dòng),可用 一個(gè)脈沖串發(fā)生器代替。發(fā)一些有聲帶振動(dòng)的音時(shí),可用一個(gè)脈沖串發(fā)生器代 替。發(fā)一些無(wú)振音的時(shí)候,因?yàn)槁晭Р⒉徽駝?dòng),而是從喉管發(fā)出的,只是一般的 隨機(jī)氣流,可以用一個(gè)噪聲發(fā)生器代替。上文介紹過(guò),聲音的強(qiáng)弱是變化的,用 一個(gè)增益因子K 來(lái)表示的話

通過(guò)上面的辦法,我們可以把語(yǔ)音信號(hào)轉(zhuǎn)化為機(jī)器人能夠理解的電信號(hào), 那么機(jī)器人又要怎樣去理解呢?

由于人類的語(yǔ)言非常復(fù)雜,無(wú)論哪個(gè)民族,其詞匯量都非常大,即使是同一個(gè) 人,他的發(fā)音也隨著環(huán)境及身體情況的變化而變化。目前在大詞匯語(yǔ)音識(shí)別方面處 于L先地位的IBM 語(yǔ)音研究小組,就是在70年代開始了大詞匯語(yǔ)音識(shí)別研究工作 的 。AT&A 的貝爾研究所也開始了一系列有關(guān)非特定人語(yǔ)音識(shí)別的實(shí)驗(yàn)。這一研究 歷經(jīng)10年,其成果是確立了如何制作用于非特定人語(yǔ)音識(shí)別的標(biāo)準(zhǔn)模板的方法。

關(guān)于語(yǔ)音識(shí)別,表4-1介紹了三種主要模式。

頻譜圖法

將語(yǔ)音信號(hào)的頻譜沿著時(shí)間軸加以展開,制成頻譜圖。此法是取語(yǔ)音信號(hào)的頻率 特性作為比較基礎(chǔ)。此種方法識(shí)別精度一般,適用于對(duì)少量語(yǔ)音的識(shí)別,及對(duì)特定 人說(shuō)話的場(chǎng)合

LPC法

即線性預(yù)估編碼法,此法是對(duì)語(yǔ)音信號(hào)抽取LPC系數(shù),然后與參考樣板的LPC系 數(shù)加以比較,計(jì)算出其間的“差距”。LPC法是模擬人的發(fā)音器官構(gòu)造而設(shè)計(jì)的。因 此,LPC系數(shù)就代表發(fā)音器官腔調(diào)的不同狀態(tài)。此法也用于特定人的語(yǔ)音識(shí)別

隱藏式馬可夫模式

此法可用于非特定人的語(yǔ)音識(shí)別。即要識(shí)別不同人的發(fā)音,并且對(duì)同一個(gè)人發(fā)同一 個(gè)音,每次發(fā)音也未必一致。這需要有大量的“儲(chǔ)存”與“比較”。此法是采用“統(tǒng) 籌”的理論,建立語(yǔ)音的狀態(tài)轉(zhuǎn)移模式。經(jīng)大量的語(yǔ)音資料得出模式的“概率”,選 出“相似率”Z高者

語(yǔ)音識(shí)別系統(tǒng)的模型通常由聲學(xué)模型和語(yǔ)言模型兩部分組成,分別對(duì)應(yīng)于 語(yǔ)音到音節(jié)概率的計(jì)算和音節(jié)到字概率的計(jì)算。在聲學(xué)模型方面,我們介紹一下 HMM 聲學(xué)模型。

HMM 聲學(xué)建模:馬爾可夫模型的概念是一個(gè)離散時(shí)域有限狀態(tài)自動(dòng)機(jī),隱 馬爾可夫模型HMM 是指這一馬爾可夫模型的內(nèi)部狀態(tài)外界不可見(jiàn),外界只能看 到各個(gè)時(shí)刻的輸出值。對(duì)語(yǔ)音識(shí)別系統(tǒng),輸出值通常就是從各個(gè)幀計(jì)算而得的聲 學(xué)特征。用HMM 刻畫語(yǔ)音信號(hào)需作出兩個(gè)假設(shè),一是內(nèi)部狀態(tài)的轉(zhuǎn)移只與上一 狀態(tài)有關(guān),另一是輸出值只與當(dāng)前狀態(tài)(或當(dāng)前的狀態(tài)轉(zhuǎn)移)有關(guān),這兩個(gè)假設(shè) 大大降低了模型的復(fù)雜度。HMM 的打分、解碼和訓(xùn)練相應(yīng)的算法是前向算法、 Viterbi算法和前向后向算法。

總的來(lái)說(shuō),語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變 為相應(yīng)的文本或命令的高技術(shù),其技術(shù)流程圖如圖4-17所示。語(yǔ)音識(shí)別技術(shù)主 要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面。語(yǔ)音識(shí)別技術(shù)車 聯(lián)網(wǎng)也得到了充分的引用,例如在翼卡車聯(lián)網(wǎng)中,只需按照一鍵通客服人員口述 要求即可設(shè)置目的地直接導(dǎo)航,安全、便捷。語(yǔ)音識(shí)別技術(shù)正朝著能識(shí)別任意人 發(fā)音的方向發(fā)展。


吉林省2020年上半年經(jīng)濟(jì)形勢(shì)分析與下半年展望

林省實(shí)現(xiàn)地區(qū)生產(chǎn)總值 5441.92 億元,按可比價(jià)格 計(jì)算,同比下降 0.4%,比一季度提高 6.2 個(gè)百分點(diǎn),高于全國(guó)平均水平 1.2 個(gè)百分點(diǎn)

孕前優(yōu)生系統(tǒng):孕前優(yōu)生健康檢查線下錄入與自動(dòng)上傳管理系統(tǒng)

孕前優(yōu)生系統(tǒng)線下錄入與自動(dòng)上傳使服務(wù)工作信息處理科學(xué)及時(shí)
資料獲取
新聞資訊
== 資訊 ==
機(jī)器人語(yǔ)音識(shí)別主要模式:頻譜圖法,LPC
機(jī)器人圖像處理的幾種方法:點(diǎn)運(yùn)算、圖像增
機(jī)器人如何看到物體:由硬件圖像采集和軟件
機(jī)器人如何規(guī)劃行走路線:全局規(guī)劃方法,局
機(jī)器人應(yīng)用的趨勢(shì):垂直化、工藝化、多樣化
協(xié)作機(jī)器人的中國(guó)市場(chǎng)格局:初具雛形,未完
中國(guó)協(xié)作機(jī)器人市場(chǎng)前景:高速穩(wěn)步增長(zhǎng),未
協(xié)作機(jī)器人市場(chǎng)的發(fā)展歷程:起步期、調(diào)整期
機(jī)器人的安全解決方案:力感知方案,輕量化
機(jī)器人的視覺(jué)解決方案:2D視覺(jué)和 3D
協(xié)作機(jī)器人與人形機(jī)器人的發(fā)展關(guān)系:應(yīng)用領(lǐng)
2025年中國(guó)協(xié)作機(jī)器人產(chǎn)業(yè)發(fā)展藍(lán)皮書,
機(jī)器人工作站的安全規(guī)范及標(biāo)準(zhǔn):安全防護(hù)空
機(jī)器人工作站的功能要求和環(huán)境條件:機(jī)器人
智能服務(wù)機(jī)器人的導(dǎo)引方式:固定路徑導(dǎo)引方
== 機(jī)器人推薦 ==
迎賓講解服務(wù)機(jī)器人

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺(tái)

機(jī)器人開發(fā)平臺(tái)


機(jī)器人底盤 Disinfection Robot 消毒機(jī)器人  講解機(jī)器人  迎賓機(jī)器人  移動(dòng)機(jī)器人底盤  商用機(jī)器人  智能垃圾站  智能服務(wù)機(jī)器人  大屏機(jī)器人  霧化消毒機(jī)器人  展廳機(jī)器人  服務(wù)機(jī)器人底盤  具身智能教育機(jī)器人  智能配送機(jī)器人  導(dǎo)覽機(jī)器人 
版權(quán)所有 創(chuàng)澤智能機(jī)器人集團(tuán)股份有限公司 運(yùn)營(yíng)中心:北京 清華科技園九號(hào)樓5層 生產(chǎn)中心:山東日照太原路71號(hào)
銷售1:4006-935-088 銷售2:4006-937-088 客服電話: 4008-128-728