圖 1 語音應用研究流程 技術基礎 語言匹配技術 語言匹配是指借用計算機,信息技術等工具,按照一定智能算法,對自然語言進行理解的過程。 計算機分析自然語言的方法主要有兩種:基于規則的方法和基于統計的方法。這兩種方法都采用了語言的匹配技術,基于統計的方法適用于大規模真實文本的處理和比較。然而,對于語音電子地圖而言,所涉及的自然語言使用范圍相對要小得多,更重要得是分析對象一般是將人的語音通過語音識別模塊的轉化而產生的文本,所以采用基于規則的方法作為基礎。 模式識別技術 模式識別是技術一種借助計算機對信息進行處理、判別的分類的技術[16-17]。 在語音導航領域中,借助句法—關鍵詞庫規則庫,進行句法規則的模式匹配,利用規則庫的相關規則,進行語言匹配和語義理解,得到計算機能夠理解的相關信息,實現計算機對自然語言的理解,從而實現基于自然語言的人機交互。 若干關鍵技術研究 主要存在的問題 基于語音控制和驅動的導航電子地圖系統的關鍵技術就是語音的識別[11][12],語音識別的準確率達不到實際應用的要求是導致語音未能普及使用的主要因素。 在導航電子地圖系統中,影響語音識別系統性能的關鍵因素主要有三個:孤立詞、背景噪音和語言隨意性問題。由于在我國地理信息名稱的文字之間有時缺乏關聯性,漢字的語音表達很難保證完全正確,極大地增加了導航電子地圖系統的語音識別難度;在實際應用中,敲擊鍵盤、點擊鼠標、挪動麥克風以及在公共場合的巨大的噪音都會為語音識別帶來困難;在用戶用和人交談的方式來進行語音輸入時,語法不規范和語序不正常會給語義分析和理解造成困擾,從而增加了語音識別的難度[2]。 語言類型的選擇 語音識別的過程(從聲音到文字)可分為兩個階段:一是聲音信號識別階段,把語音設備采集的聲音信號轉換為機器可以處理的數字表達的音節形式(或拼音形式);二是音字轉換階段,把音節或拼音字母轉換為對應的漢字形式。
圖2 商品化漢字語音識別模塊的工作流程 由于漢字不是拼音字母,漢字和語音之間是通過拼音聯系起來的,但是漢字和拼音之間不是一一對應的關系,存在大量的一字多音和一音多字的情況。在音字轉換的過程中,雖然可以運用基于統計的方法和基于規則的方法來解決同音字的問題[3],但是無法保證轉化后的漢字為該語音的原意,而且在我國地理名稱的文字之間有時缺乏關聯性,加大了音字轉換的難度,所以我們采用基于拼音的語音處理策略,可以在一定程度上解決孤立詞對語音識別的影響。 由于地域差異,人們說話時通常帶有方言口音,譬如,江浙人“黃、王”不分,平翹、前后鼻音不分等等。發音不準的問題可以采用模糊音的方法來解決,而基于拼音字符串的語音處理更有利于進行模糊音的匹配。 在模糊拼音匹配的過程中,建立模糊拼音文件,分為聲母和韻母兩個部分,分別給具有模糊關聯的音節指定相同的碼值,在實際應用中用戶可以根據自己發音的情況建立對應的模糊拼音文件,以提高語音識別率。但是,有時候在模糊音環境下可能會混淆兩個具有相近語音的地名,針對這一種情況,系統可以采用為發音準確的用戶提供模糊音可選項的策略。 其中,模糊拼音匹配的基本過程如下: (1)將源串和目標串按分隔符(一般為空格)進行分割按順序分別進隊列和,并得到源串和目標船的詞數和,如果 返回不匹配; (2)隊列和分別出隊,得到兩個詞和,將詞按聲韻母分割并獲得相應的碼值存入兩個整數數組和,其中,因為拼音音節最多由聲母和韻母組成; (3)分別比較聲母和韻母的碼值,如果或,返回不匹配; (4)轉到(2),直至?眨祷仄ヅ洹 導航句法規則庫的建立 Hockett(1958)站在行為主義哲學立場上,認為人之所以能夠理解沒有接觸過的話語是因為這些話語不過是把熟悉的素材(語素、詞)填入熟悉的模式(主謂、述賓、偏正等結構方式)。如果讓計算機理解自然語言的時候亦可以采用這種方式。 (1)句法分析 一般化自然語言素材和模式及其組成相當復雜,面向導航領域的自然語言相對簡單得多。下面我們對“我要找南京師范大學”一句簡單的查詢語句進行簡單分析,如圖3。
“我要找南京師范大學”是一般現在時態下的疑問句式,語句中“我”是主語,“要找”為謂語動詞,“南京師范大學”則為賓語。在進行語義理解時,只要能夠抓住謂語動詞“要找”,就能理解語句的目的是查詢一處地方,而賓語“南京師范大學”則就為要查詢的地方。 由此可見謂詞是語句的語義核心,也是提取句子成分的關鍵。因此,在建立關鍵詞庫的時候,通常就將謂詞作為關鍵詞入庫,并由謂語動詞決定句法。 (2)句法—關鍵詞規則庫的結構 喬姆斯基的形式語法G是一個四元組 G = (Vn,Vt, S, P) 其中是Vn非終端符號的集合,Vt是終端符號的集合,S表示句子,P表示規則。具有這種形式的語法叫做上下文無關語法(context-free grammar)。在語音電子地圖中這些符號有更具體的含義,以語音導航語句為例: Vt是關鍵詞,是不可再分的單元,也是用于匹配的最基本單元。以語音導航為例,通常包括以下關鍵詞類: 動詞:如查詢,去,到,是,問等等; 方位詞:如北面,左邊,隔壁,對面,附近等等; 修飾詞:如大,近,方便,快,最,比較,大約等等; 疑問詞:如如何,怎么,哪,多久,多遠等等; 其他關鍵詞:如我,你,請,從,要等等。 Vn是復合關鍵詞,它是單元關鍵詞的組合,用于對句子成分的粗劃分。如“請問”+“去”,“查詢”+“最大的”等。有些時候由于固定搭配,或者分割為單元關鍵詞對于應用來說沒有多大的意義,如 “我”+“要”=“我要”,“告訴”+“我”=“告訴我”等等,故常常將這樣的Vn按照擴展的Vt,當成關鍵短語進行處理。 P是句型,語音導航電子地圖中涉及的句型并不復雜,并且數量有限,下面列舉了幾種常見句型: 動賓結構 —— v. + 目的地。如:查詢南京師范大學 主動賓結構 —— Sbj. + v. + 目的地。如:我要到南京師范大學 從到結構 —— Sbj. + v. +“從”+源地+“到”+目的地。如:我要從新街口到南京師范大學 主動疑問式結構 —— 目的地+疑問詞。如:南京師范大學在哪 賓動疑問式結構 —— 疑問詞+目的地。如:怎么到南京師范大學 …… (3)句法—關鍵詞規則庫的應用方法 根據句法—關鍵詞規則庫,采用直接定位的方法來實現對語句的功能(如導航、查詢)劃分和成分提取。本方法的基本思想是:先定位句子中的候選關鍵詞(或候選關鍵短語),再根據與之相關聯的句型對句子進行劃分測試,直到找到最為匹配的最適關鍵詞及其對應的最適句型,完成成分提取。 關鍵詞匹配提取語句成分的基本過程: ①從句法—關鍵詞規則庫中提取一個規則,提取規則中的關鍵詞集合; ②如果在句子中找到該關鍵詞集合,則根據對應的句型對句子進行劃分,返回劃分結果;如果沒有找到,則轉到①; ③直至句法—關鍵詞庫中的規則都提取到,返回無法劃分。 拼音字符串的相近匹配度計算 在文章里曾經提到影響語音識別的三大問題,其中背景噪音對語音識別的影響很大,在實際應用中,噪聲是不可避免的。目前,在現有的語音識別系統中,主要是通過對語音信號的處理來降低噪聲[13-14],包括語音增強、噪聲屏蔽[4]、特征提取參數[5]和自適應處理[6]等。對于導航電子地圖而言,由于有地理信息數據庫的支持,盡管采用現有的語音識別軟件獲取的語音數據很可能帶有噪音,但可以利用現有的先驗數據,通過近似的模糊匹配,來提高語音識別的效率。 為了克服現有技術存在的缺陷,針對目前漢語語音識別軟件在噪聲環境下存在的識
首頁 上一頁 1 2 下一頁 尾頁 2/2/2
本站部分文章來自網絡,如發現侵犯了您的權益,請聯系指出,本站及時確認刪除 E-mail:349991040@qq.com
論文格式網(www.donglienglish.cn--論文格式網拼音首字母組合)提供其他論文畢業論文格式,論文格式范文,畢業論文范文