電子通信論文編號:TX115 字數:13773,頁數:29
目錄 目錄 1 前言 3 第一章 緒論 4 1.1開發背景 4 1.2搜索引擎發展現狀 5 1.3課題的主要內容 5 第二章 搜索引擎的概況與分析 6 2.1搜索引擎分類 7 2.1.1全文搜索引擎 7 2.1.2目錄索引 7 2.1.3元搜索引擎 7 2.2搜索引擎的結構 7 2.2.1 Robot爬行程序 8 2.2.2索引模塊 8 2.2.3 搜索模塊 10 2.3垂直搜索引擎技術 10 2.3.1垂直搜索引擎 11 2.3.2 垂直搜索的劃分 11 2.3.3垂直搜索引擎的相關技術 11 2.4小結 12 第三章 正則表達式 13 3.1起源 13 3.2定義 13 3.3使用 14 3.3.1 正則表達式的組成 14 3.3.2正則表達式的運用 17 3.4小結 19 第四章 系統的設計與開發 19 4.1 系統概述 20 4.2 有向Robot技術 20 4.2.1搜索Robot 20 4.2.2挖掘Robot 20 4.2.3收集Robot 21 4.3索引器 21 4.3.1中文分詞技術 21 4.3.2 建立標引庫 23 4.4 網頁的分析提取 23 4.4.1網頁內容的提取 23 4.4.2網頁分析 25 4.5 數據表 26 4.6 交互界面 26 4.7 小結 26 結束語 27 參考文獻 28 致謝 29
前言 面對浩瀚的網絡資源,搜索引擎為所有網上沖浪的用戶提供了一個入口,毫不夸張的說,所有的用戶都可以從搜索出發到達自己想去的網上任何一個地方。 作為近年來互聯網發展的熱點之一,搜索引擎受到各方面的關注。可以想象如果離開了搜索引擎的幫助,使用者能夠涉獵的互聯網范圍無疑將被大大限制。 搜索引擎一詞在國內外因特網領域被廣泛使用,然而他的含義卻不盡相同。在美國搜索引擎通常指的是基于因特網的搜索引擎,他們通過網絡機器人程序收集上千萬到幾億個網頁,并且每一個詞都被搜索引擎索引,也就是我們說的全文檢索。著名的因特網搜索引擎包括First Search、Google、HotBot等。在中國,搜索引擎通常指基于網站目錄的搜索服務或是特定網站的搜索服務。
本站部分文章來自網絡,如發現侵犯了您的權益,請聯系指出,本站及時確認刪除 E-mail:349991040@qq.com
論文格式網(www.donglienglish.cn--論文格式網拼音首字母組合)提供電子通信論文畢業論文格式,論文格式范文,畢業論文范文