論文格式
          電氣工程 會計論文 金融論文 國際貿易 財務管理 人力資源 輕化工程 德語論文 工程管理 文化產業管理 信息計算科學 電氣自動化 歷史論文
          機械設計 電子通信 英語論文 物流論文 電子商務 法律論文 工商管理 旅游管理 市場營銷 電視制片管理 材料科學工程 漢語言文學 免費獲取
          制藥工程 生物工程 包裝工程 模具設計 測控專業 工業工程 教育管理 行政管理 應用物理 電子信息工程 服裝設計工程 教育技術學 論文降重
          通信工程 電子機電 印刷工程 土木工程 交通工程 食品科學 藝術設計 新聞專業 信息管理 給水排水工程 化學工程工藝 推廣賺積分 付款方式
          • 首頁 |
          • 畢業論文 |
          • 論文格式 |
          • 個人簡歷 |
          • 工作總結 |
          • 入黨申請書 |
          • 求職信 |
          • 入團申請書 |
          • 工作計劃 |
          • 免費論文 |
          • 現成論文 |
          • 論文同學網 |
          搜索 高級搜索

          當前位置:論文格式網 -> 免費論文 -> 其他論文

          導航電子地圖中的語音匹配與模式識別(二)

          本論文在其他論文欄目,由論文格式網整理,轉載請注明來源www.donglienglish.cn,更多論文,請點論文格式范文查看
          語音應用流程
           在計算機系統中語音的應用包含了語音輸入、語音識別、語言匹配和語義理解、語言應用四個主要環節,如圖1。
           其中,語音輸入通過語音錄入設備將人的自然語言轉換為數字語音信號,這是語音應用的開始環節;語音識別包括語音特征提取、聲學模型和模式匹配(識別算法)兩個部分,前者從語音波形中提取隨時間變化的語音特征序列,后者應用發音模板,將未知的語音特征同其構建的聲學模型進行匹配比較,判斷其所屬文字,語音識別的質量直接關系到語音的應用效果;語言匹配和語義理解是語音應用的關鍵環節,它按照語法規則對語音識別得到的文字字符串進行匹配和分解,得到關鍵詞和相關文字信息,并將其轉換為計算機能夠理解的機器語言;最后,在應用系統中把理解后的機器語言與命令函數連接起來,調用并執行相應命令。
           本文的研究重點沒有放在語音識別上,而是側重在針對導航系統應用的語言匹配理解上,這才是專業領域應用的關鍵。研究流程主要是通過現有語音識別軟件識別語音成字符串,通過建立的句法—關鍵詞規則庫進行語言匹配和語義理解,得到計算機能夠處理的信息,從而進行語言應用。

          圖 1 語音應用研究流程
          技術基礎
           語言匹配技術
           語言匹配是指借用計算機,信息技術等工具,按照一定智能算法,對自然語言進行理解的過程。
           計算機分析自然語言的方法主要有兩種:基于規則的方法和基于統計的方法。這兩種方法都采用了語言的匹配技術,基于統計的方法適用于大規模真實文本的處理和比較。然而,對于語音電子地圖而言,所涉及的自然語言使用范圍相對要小得多,更重要得是分析對象一般是將人的語音通過語音識別模塊的轉化而產生的文本,所以采用基于規則的方法作為基礎。
           模式識別技術
           模式識別是技術一種借助計算機對信息進行處理、判別的分類的技術[16-17]。
           在語音導航領域中,借助句法—關鍵詞庫規則庫,進行句法規則的模式匹配,利用規則庫的相關規則,進行語言匹配和語義理解,得到計算機能夠理解的相關信息,實現計算機對自然語言的理解,從而實現基于自然語言的人機交互。
          若干關鍵技術研究
          主要存在的問題
           基于語音控制和驅動的導航電子地圖系統的關鍵技術就是語音的識別[11][12],語音識別的準確率達不到實際應用的要求是導致語音未能普及使用的主要因素。
           在導航電子地圖系統中,影響語音識別系統性能的關鍵因素主要有三個:孤立詞、背景噪音和語言隨意性問題。由于在我國地理信息名稱的文字之間有時缺乏關聯性,漢字的語音表達很難保證完全正確,極大地增加了導航電子地圖系統的語音識別難度;在實際應用中,敲擊鍵盤、點擊鼠標、挪動麥克風以及在公共場合的巨大的噪音都會為語音識別帶來困難;在用戶用和人交談的方式來進行語音輸入時,語法不規范和語序不正常會給語義分析和理解造成困擾,從而增加了語音識別的難度[2]。
          語言類型的選擇
           語音識別的過程(從聲音到文字)可分為兩個階段:一是聲音信號識別階段,把語音設備采集的聲音信號轉換為機器可以處理的數字表達的音節形式(或拼音形式);二是音字轉換階段,把音節或拼音字母轉換為對應的漢字形式。
           

          圖2 商品化漢字語音識別模塊的工作流程
           由于漢字不是拼音字母,漢字和語音之間是通過拼音聯系起來的,但是漢字和拼音之間不是一一對應的關系,存在大量的一字多音和一音多字的情況。在音字轉換的過程中,雖然可以運用基于統計的方法和基于規則的方法來解決同音字的問題[3],但是無法保證轉化后的漢字為該語音的原意,而且在我國地理名稱的文字之間有時缺乏關聯性,加大了音字轉換的難度,所以我們采用基于拼音的語音處理策略,可以在一定程度上解決孤立詞對語音識別的影響。
           由于地域差異,人們說話時通常帶有方言口音,譬如,江浙人“黃、王”不分,平翹、前后鼻音不分等等。發音不準的問題可以采用模糊音的方法來解決,而基于拼音字符串的語音處理更有利于進行模糊音的匹配。
           在模糊拼音匹配的過程中,建立模糊拼音文件,分為聲母和韻母兩個部分,分別給具有模糊關聯的音節指定相同的碼值,在實際應用中用戶可以根據自己發音的情況建立對應的模糊拼音文件,以提高語音識別率。但是,有時候在模糊音環境下可能會混淆兩個具有相近語音的地名,針對這一種情況,系統可以采用為發音準確的用戶提供模糊音可選項的策略。
           其中,模糊拼音匹配的基本過程如下:
           (1)將源串和目標串按分隔符(一般為空格)進行分割按順序分別進隊列和,并得到源串和目標船的詞數和,如果 返回不匹配;
           (2)隊列和分別出隊,得到兩個詞和,將詞按聲韻母分割并獲得相應的碼值存入兩個整數數組和,其中,因為拼音音節最多由聲母和韻母組成;
           (3)分別比較聲母和韻母的碼值,如果或,返回不匹配;
           (4)轉到(2),直至?眨祷仄ヅ洹
          導航句法規則庫的建立
           Hockett(1958)站在行為主義哲學立場上,認為人之所以能夠理解沒有接觸過的話語是因為這些話語不過是把熟悉的素材(語素、詞)填入熟悉的模式(主謂、述賓、偏正等結構方式)。如果讓計算機理解自然語言的時候亦可以采用這種方式。
           (1)句法分析
           一般化自然語言素材和模式及其組成相當復雜,面向導航領域的自然語言相對簡單得多。下面我們對“我要找南京師范大學”一句簡單的查詢語句進行簡單分析,如圖3。

           “我要找南京師范大學”是一般現在時態下的疑問句式,語句中“我”是主語,“要找”為謂語動詞,“南京師范大學”則為賓語。在進行語義理解時,只要能夠抓住謂語動詞“要找”,就能理解語句的目的是查詢一處地方,而賓語“南京師范大學”則就為要查詢的地方。
           由此可見謂詞是語句的語義核心,也是提取句子成分的關鍵。因此,在建立關鍵詞庫的時候,通常就將謂詞作為關鍵詞入庫,并由謂語動詞決定句法。
           (2)句法—關鍵詞規則庫的結構
           喬姆斯基的形式語法G是一個四元組
          G = (Vn,Vt, S, P)
           其中是Vn非終端符號的集合,Vt是終端符號的集合,S表示句子,P表示規則。具有這種形式的語法叫做上下文無關語法(context-free grammar)。在語音電子地圖中這些符號有更具體的含義,以語音導航語句為例:
           Vt是關鍵詞,是不可再分的單元,也是用于匹配的最基本單元。以語音導航為例,通常包括以下關鍵詞類:
           動詞:如查詢,去,到,是,問等等;
           方位詞:如北面,左邊,隔壁,對面,附近等等;
           修飾詞:如大,近,方便,快,最,比較,大約等等;
           疑問詞:如如何,怎么,哪,多久,多遠等等;
           其他關鍵詞:如我,你,請,從,要等等。
           Vn是復合關鍵詞,它是單元關鍵詞的組合,用于對句子成分的粗劃分。如“請問”+“去”,“查詢”+“最大的”等。有些時候由于固定搭配,或者分割為單元關鍵詞對于應用來說沒有多大的意義,如 “我”+“要”=“我要”,“告訴”+“我”=“告訴我”等等,故常常將這樣的Vn按照擴展的Vt,當成關鍵短語進行處理。
           P是句型,語音導航電子地圖中涉及的句型并不復雜,并且數量有限,下面列舉了幾種常見句型:
           動賓結構   ——  v. + 目的地。如:查詢南京師范大學
           主動賓結構 —— Sbj. + v. + 目的地。如:我要到南京師范大學
           從到結構   —— Sbj. + v. +“從”+源地+“到”+目的地。如:我要從新街口到南京師范大學
           主動疑問式結構 —— 目的地+疑問詞。如:南京師范大學在哪
           賓動疑問式結構 —— 疑問詞+目的地。如:怎么到南京師范大學
           ……
           (3)句法—關鍵詞規則庫的應用方法
           根據句法—關鍵詞規則庫,采用直接定位的方法來實現對語句的功能(如導航、查詢)劃分和成分提取。本方法的基本思想是:先定位句子中的候選關鍵詞(或候選關鍵短語),再根據與之相關聯的句型對句子進行劃分測試,直到找到最為匹配的最適關鍵詞及其對應的最適句型,完成成分提取。
           關鍵詞匹配提取語句成分的基本過程:
          ①從句法—關鍵詞規則庫中提取一個規則,提取規則中的關鍵詞集合;
          ②如果在句子中找到該關鍵詞集合,則根據對應的句型對句子進行劃分,返回劃分結果;如果沒有找到,則轉到①;
          ③直至句法—關鍵詞庫中的規則都提取到,返回無法劃分。
          拼音字符串的相近匹配度計算
           在文章里曾經提到影響語音識別的三大問題,其中背景噪音對語音識別的影響很大,在實際應用中,噪聲是不可避免的。目前,在現有的語音識別系統中,主要是通過對語音信號的處理來降低噪聲[13-14],包括語音增強、噪聲屏蔽[4]、特征提取參數[5]和自適應處理[6]等。對于導航電子地圖而言,由于有地理信息數據庫的支持,盡管采用現有的語音識別軟件獲取的語音數據很可能帶有噪音,但可以利用現有的先驗數據,通過近似的模糊匹配,來提高語音識別的效率。
          為了克服現有技術存在的缺陷,針對目前漢語語音識別軟件在噪聲環境下存在的識

          首頁 上一頁 1 2 下一頁 尾頁 2/2/2


          相關論文
          上一篇:小型超市管理系統-可定制 下一篇:基于JSP的在線投票系統的設計與實..
          Tags:導航 電子地圖 語音 匹配 模式 識別 【收藏】 【返回頂部】
          人力資源論文
          金融論文
          會計論文
          財務論文
          法律論文
          物流論文
          工商管理論文
          其他論文
          保險學免費論文
          財政學免費論文
          工程管理免費論文
          經濟學免費論文
          市場營銷免費論文
          投資學免費論文
          信息管理免費論文
          行政管理免費論文
          財務會計論文格式
          數學教育論文格式
          數學與應用數學論文
          物流論文格式范文
          財務管理論文格式
          營銷論文格式范文
          人力資源論文格式
          電子商務畢業論文
          法律專業畢業論文
          工商管理畢業論文
          漢語言文學論文
          計算機畢業論文
          教育管理畢業論文
          現代教育技術論文
          小學教育畢業論文
          心理學畢業論文
          學前教育畢業論文
          中文系文學論文
          最新文章
          熱門文章
          計算機論文
          推薦文章

          本站部分文章來自網絡,如發現侵犯了您的權益,請聯系指出,本站及時確認刪除 E-mail:349991040@qq.com

          論文格式網(www.donglienglish.cn--論文格式網拼音首字母組合)提供其他論文畢業論文格式,論文格式范文,畢業論文范文

          Copyright@ 2010-2018 LWGSW.com 論文格式網 版權所有

          感谢您访问我们的网站,您可能还对以下资源感兴趣:

          论文格式网:毕业论文格式范文