論文格式
        電氣工程 會計論文 金融論文 國際貿易 財務管理 人力資源 輕化工程 德語論文 工程管理 文化產業管理 信息計算科學 電氣自動化 歷史論文
        機械設計 電子通信 英語論文 物流論文 電子商務 法律論文 工商管理 旅游管理 市場營銷 電視制片管理 材料科學工程 漢語言文學 免費獲取
        制藥工程 生物工程 包裝工程 模具設計 測控專業 工業工程 教育管理 行政管理 應用物理 電子信息工程 服裝設計工程 教育技術學 論文降重
        通信工程 電子機電 印刷工程 土木工程 交通工程 食品科學 藝術設計 新聞專業 信息管理 給水排水工程 化學工程工藝 推廣賺積分 付款方式
        • 首頁 |
        • 畢業論文 |
        • 論文格式 |
        • 個人簡歷 |
        • 工作總結 |
        • 入黨申請書 |
        • 求職信 |
        • 入團申請書 |
        • 工作計劃 |
        • 免費論文 |
        • 合作期刊 |
        • 論文同學網 |
        搜索 高級搜索

        當前位置:論文格式網 -> 畢業論文 -> 計算機論文
        畢業論文標題:

        基于字符編輯的字符串匹配算法的實現

         本文ID:LWGSW13456 價格:收費積分/100
        掃一掃 掃一掃
        本站會員可自行下載:下載地址 undefined    迅雷高速下載    快車高速下載
        下載地址 字符編輯的字符串匹配算法的實現 (收費:1000 積分)  

        論文字數:8972,頁數:24

        摘  要
         隨著信息技術的迅猛發展,各種數據生成以及數據采集設備的廣泛使用,人們獲取到的數據量指數級增長,但是人們從海量數據中獲取信息的方便性并沒有得到有效的改善,究其原因,其一就是數據質量大大下降,不足以滿足應用的需求。
         本文介紹了對數據質量研究的必要性以及目前數據質量研究的熱點,并著重介紹通過記錄連接來改善數據質量問題。通過匹配技術中的編輯距離算法、Jaro-Winkler算法達到進行記錄連接的目的,并對算法的原理及其實現作了闡述,通過計算兩個記錄的相似度來解決基于字符編輯的字符串匹配問題,實現對重復相似記錄的檢測以達到數據連接的目的,最后對匹配技術對數據質量研究的展望。
         
        關鍵詞:數據質量; 記錄連接; 匹配; 編輯距離; Levenshtein算法; Jaro-Winkler算法
        String Matching Algorithm and its Realization
        Based on Character Editor
        ABSTRACT
         With the rapid development of information technology and various data generation and data acquisition equipment widely used ,the amount of data which people get is increasing by exponential,however, the huge amounts of data which people get in the convenience of access to information has not been effective improvement, one of reseaons is that data quality significantly decreased and insufficient to meet the application requirements.
         This paper introduces the necessarity of researching data quality and describes the current hot topic of data quality ,then puts an emphasis on introducing through the records to improve data quality problems. Through the matching technology in the edit distance, Jaro-Winkler algorithm to achieve the purpose of record linkage,then describe the Principles and implementation of the algorithm .Through Introduces the useage of the edit distance algorithm, Jaro-Winkler algorithm of matching technology and how to realize them ,through calculating the similarity of two records to solve the character-based string matching editor to achieve  detection of duplicate records ,finally looks forward to the research on matching technology for data quality.

         Keywords:Data Quality; Record Linkage; Matching; Edit distance; Levenshtein Algorithm; Jaro-Winkler Algorithm
        目   錄
        摘  要 i
        ABSTRACT ii
        第一章 緒論 - 1 -
        第二章 編輯距離 (Edit distance) - 3 -
        2.1 Levenshtein算法思想 - 3 -
        2.2 Levenshtein算法原理 - 3 -
        2.3 算法的實現 - 4 -
        2.3.1 Levenshtein算法 - 4 -
        2.3.2 Levenshtein算法實現 - 5 -
        2.4 正確性說明 - 6 -
        2.5 Levenshtein算法補充說明 - 6 -
        第三章 Jaro-Winkler距離(Jaro-Winkler Distance) - 7 -
        3.1 Jaro算法 - 7 -
        3.1.1 Jaro算法原理 - 7 -
        3.1.2 Jaro算法實現 - 7 -
        3.2 Jaro-winkler算法 - 10 -
        3.2.1 Jaro-winkler原理 - 10 -
        3.2.2 Jaro-winkler實現 - 10 -
        3.2.3 算法相關補充說明 - 12 -
        結束語 - 13 -
        致謝 - 14 -
        參考文獻 - 15 -
        附錄 - 16 -


        相關論文
        本論文在計算機論文欄目,由論文格式網整理,轉載請注明來源www.donglienglish.cn,更多論文,請點論文格式范文查看
        上一篇:圖書網上查詢系統 下一篇:基于Delphi的車輛管理系統的設計..
        Tags:字符編輯 字符串匹配算法 【收藏】 【返回頂部】
        最新文章
        熱門文章
        計算機論文
        推薦文章

        本站部分文章來自網絡,如發現侵犯了您的權益,請聯系指出,本站及時確認刪除 E-mail:349991040@qq.com

        論文格式網(www.donglienglish.cn--論文格式網拼音首字母組合)提供計算機論文畢業論文格式,論文格式范文,畢業論文范文

        Copyright@ 2010-2018 LWGSW.com 論文格式網 版權所有 蜀ICP備09018832號

        感谢您访问我们的网站,您可能还对以下资源感兴趣:

        论文格式网:毕业论文格式范文