論文格式
              電氣工程 會計論文 金融論文 國際貿(mào)易 財務(wù)管理 人力資源 輕化工程 德語論文 工程管理 文化產(chǎn)業(yè)管理 信息計算科學(xué) 電氣自動化 歷史論文
              機(jī)械設(shè)計 電子通信 英語論文 物流論文 電子商務(wù) 法律論文 工商管理 旅游管理 市場營銷 電視制片管理 材料科學(xué)工程 漢語言文學(xué) 免費獲取
              制藥工程 生物工程 包裝工程 模具設(shè)計 測控專業(yè) 工業(yè)工程 教育管理 行政管理 應(yīng)用物理 電子信息工程 服裝設(shè)計工程 教育技術(shù)學(xué) 論文降重
              通信工程 電子機(jī)電 印刷工程 土木工程 交通工程 食品科學(xué) 藝術(shù)設(shè)計 新聞專業(yè) 信息管理 給水排水工程 化學(xué)工程工藝 推廣賺積分 付款方式
              • 首頁 |
              • 畢業(yè)論文 |
              • 論文格式 |
              • 個人簡歷 |
              • 工作總結(jié) |
              • 入黨申請書 |
              • 求職信 |
              • 入團(tuán)申請書 |
              • 工作計劃 |
              • 免費論文 |
              • 合作期刊 |
              • 論文同學(xué)網(wǎng) |
              搜索 高級搜索

              當(dāng)前位置:論文格式網(wǎng) -> 畢業(yè)論文 -> 計算機(jī)論文
              畢業(yè)論文標(biāo)題:

              基于LUCENE的站內(nèi)搜索引擎的設(shè)計與實現(xiàn)

               本文ID:LWGSW13498 價格:收費積分/100
              掃一掃 掃一掃
              本站會員可自行下載:下載地址 基于LUCENE的站內(nèi)搜索引擎的設(shè)計與實現(xiàn) (收費:1000 積分)  

              論文字?jǐn)?shù):16707,頁數(shù):41 有開題報告,任務(wù)書,PPT

              摘   要
               LUCENE[1]是apache軟件基金會jakarta項目組的一個子項目,是一個開放源代碼的全文檢索引擎工具包,即它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎,LUCENE的目的是為軟件開發(fā)人員提供一個簡單易用的工具包,以方便的在目標(biāo)系統(tǒng)中實現(xiàn)全文檢索的功能,或者是以此為基礎(chǔ)建立起完整的全文檢索引擎。
               作為一個開放源代碼項目,LUCENE從問世之后,引發(fā)了開放源代碼社群的巨大反響,程序員們不僅使用它構(gòu)建具體的全文檢索應(yīng)用,而且將之集成到各種系統(tǒng)軟件中去,以及構(gòu)建Web應(yīng)用,甚至某些商業(yè)軟件也采用了LUCENE作為其內(nèi)部全文檢索子系統(tǒng)的核心。apache軟件基金會的網(wǎng)站使用了LUCENE作為全文檢索的引擎,IBM的開源軟件eclipse的2.1版本中也采用了LUCENE作為幫助子系統(tǒng)的全文索引引擎,相應(yīng)的IBM的商業(yè)軟件Web Sphere中也采用了LUCENE。LUCENE以其開放源代碼的特性、優(yōu)異的索引結(jié)構(gòu)、良好的系統(tǒng)架構(gòu)獲得了越來越多的應(yīng)用。
               這個系統(tǒng)的實際需求來源于本人在企業(yè)里實習(xí)時開發(fā)的2007世界特殊奧林匹克運動會官方網(wǎng)站,這個官方網(wǎng)站也使用了站內(nèi)搜索引擎的功能,這個搜索引擎是我用LUCENE在.NET平臺上實現(xiàn)的,現(xiàn)在網(wǎng)站運行穩(wěn)定,站內(nèi)搜索使整個網(wǎng)站的功能更加強大,為用戶提供了更為便利的搜索功能。
               本文對搜索引擎的原理、組成、數(shù)據(jù)結(jié)構(gòu)、工作流程等方面做了深入而細(xì)致地研究與分析。并且通過LUCENE來設(shè)計和實現(xiàn)一個全文檢索站內(nèi)搜索引擎系統(tǒng),最后通過增量索引和優(yōu)化索引兩個方面來說明如何提高LUCENE的高效性。
               
              關(guān)鍵詞: 全文檢索,搜索引擎,LUCENE ,jakarta
               Design and Realization of Search Engine in Site Base On LUCENE

              Abstract
                              
               LUCENE is a sub-project of jakarta project team in apache software foundation, and is a tool kit of full-text search engine of open source, that is not a complete full-text search engine, but is a framework of full-text search engine to provide integral inquire engine and index engine. LUCENE is designed to provide a simple, easy-to-use tool kit for software developers,and it’s convenient to realize the full-text retrieva l function  in the target system , or as a  basis to establish the integral  full-text search engine.
               As an open source project, LUCENE brings tremendous response in the open source community after its appearance. The programmers not only use it to build concrete full-text retrieva l applications, but also make it integrate into various of systems software, and build web applications, even some commercial software are using LUCENE as its core of full-text retrieva l subsystems. Apache Software Foundation website uses LUCENE as a full-text search engine, LUCENE is used to help full-text index engine of subsystem in the 2.1 version of IBM's software revenue eclipse. As the IBM’s corresponding commercial software Web Sphere also uses LUCENE. LUCENE gets more and more applications with open source characteristics, excellent index structure, good system architecture.
               The actual requirements of this system origins from my development on “2007 Special Olympics World official website” when I practiced in the enterprise. The official website also uses the function of station search engine, I use the LUCENE to realize the search engine in .NET platform. Now for stable operation, station search make the function of the whole site become more powerful, and to provide users with a more convenient search function.
               I have carefully studied and analysis search engines principle, composition, data structure, and work flow, and have designed and realized a full-text retrieva l stations search engine by means of LUCENE. Finally, both to I illustrate how to improve the efficiency of LUCENE through two aspects, the increment index and the optimization index.
               
              Key Words: Full Text Retrieva l,Search Engine,jakarta

              目       錄
              1.緒論 1
              1.1課題背景 1
              1.2課題目前研究情況及存在問題 2
              1.3論文組織結(jié)構(gòu) 2
              2.全文檢索與LUCENE 3
              2.1全文檢索與全文檢索簡介 3
              2.2全文檢索系統(tǒng)與數(shù)據(jù)庫比較 4
              2.3 LUCENE簡介 8
              2.4 LUCENE的應(yīng)用、特點及優(yōu)勢 9
              2.5互聯(lián)網(wǎng)搜索引擎的研究 10
              2.6中文分詞的簡單介紹 11
              3.LUCENE系統(tǒng)結(jié)構(gòu) 12
              3.1 LUCENE系統(tǒng)結(jié)構(gòu)組織 12
              3.2 數(shù)據(jù)流分析 12
              3.3 LUCENE索引文件格式分析 14
              3.3.1 LUCENE源碼實現(xiàn)分析的說明 14
              3.3.2 LUCENE索引文件格式 14
              3.4 LUCENE的倒排序原理 17
              3.5 LUCENE搜索結(jié)果排序 20
              4.系統(tǒng)設(shè)計與實現(xiàn) 21
              4.1系統(tǒng)需求 21
              4.2開發(fā)環(huán)境與工具 22
              4.3系統(tǒng)組織結(jié)構(gòu) 24
              4.4流程實現(xiàn) 25
              4.4.1根據(jù)網(wǎng)站中不同模塊建立生成動態(tài)索引 25
              4.4.2搜索界面 26
              4.4.3 搜索結(jié)果界面 27
              5.關(guān)鍵技術(shù) 28
              5.1 LUCENE增量索引 28
              5.2優(yōu)化索引 28
              5.3 LUCENE文件格式的通用性 29
              5.4對于私密文件的處理 31
              總  結(jié) 32
              致  謝 33
              參考文獻(xiàn) 34
              附錄A 主要源程序 35


              相關(guān)論文
              本論文在計算機(jī)論文欄目,由論文格式網(wǎng)整理,轉(zhuǎn)載請注明來源www.donglienglish.cn,更多論文,請點論文格式范文查看
              上一篇:統(tǒng)一用戶管理系統(tǒng)及在門戶中的應(yīng)用 下一篇:嵌入式Linux下USB驅(qū)動程序的研究..
              Tags:LUCENE 站內(nèi)搜索引擎 搜索引擎 設(shè)計與實現(xiàn) 【收藏】 【返回頂部】
              最新文章
              熱門文章
              計算機(jī)論文
              推薦文章

              本站部分文章來自網(wǎng)絡(luò),如發(fā)現(xiàn)侵犯了您的權(quán)益,請聯(lián)系指出,本站及時確認(rèn)刪除 E-mail:349991040@qq.com

              論文格式網(wǎng)(www.donglienglish.cn--論文格式網(wǎng)拼音首字母組合)提供計算機(jī)論文畢業(yè)論文格式,論文格式范文,畢業(yè)論文范文

              Copyright@ 2010-2018 LWGSW.com 論文格式網(wǎng) 版權(quán)所有 蜀ICP備09018832號

              感谢您访问我们的网站,您可能还对以下资源感兴趣:

              论文格式网:毕业论文格式范文