文獻信息檢索論文
一、文獻的基礎知識
1.文獻的概念 文獻是記錄知識的一切載體。具體地說,文獻是將知識、信息用文字、符號、圖像、音頻等記錄在一定的物質載體上的結合體。由此定義我們可以看出,文獻具有三個基本屬性,即文獻的知識性、記錄性和物質性。它具有存貯知識、傳遞和交流信息的功能。
2.文獻的特征分為外部形態特征和內部形態特征兩大部分. 1)文獻的外部特征 文獻名稱:它是文獻內容的概括. 著者名稱:它是指對文獻負有一定責任的個人或機關團體. 版本:包括版次和版刻,指文獻的排版次數,用來表明文獻版本的重要變更. 出版地:是指出版者所在的地域名稱. 出版者:包括負責整理,付印出版的機關團體或出版企業組織等. 版期:它取決于,版次,主要指某版次的出版時間. 載體形態:指文獻的頁數,卷數,插圖,折圖,彩圖,照片,開本,尺寸等. 標準書號和刊號:指圖書的ISBN號和期刊的ISSN號.
2)文獻的內部形態特征是指可以揭示文獻內容和實質的標識,有分類號和主題兩種. 分類號:文獻分類就是根據確定好的邏輯系統,將文獻信息所載知識單元與形式特征,利用號碼標識進行分門別類的系統揭示與組織.其中,用來代表類目名稱的標識符號稱為分類號.從分類號可以得知文獻的學科屬性,內容實質.比如:文學用"I"字母來標識,中國小說用"I24"來標識. 主題詞:它是一種以語詞為檢索標識,采用詞語結識和描述文獻信息主題內容,按照主題字順組織文獻的情報檢索語言.主題詞是文獻的中心思想和所要表達的重要內容的高度概括.
3.文獻的類型 1)零次文獻:指未以公開形式進入社會流通使用的實驗記錄,會議記錄,內部檔案,論文草稿,設計草稿等. 2)一次文獻:指以作者本人的研究工作或研制成果為依據撰寫,已公開發行進入社會流通使用的專著,學術論文,專利說明書,科技報告等. 3)二次文獻:指對一次文獻信息進行整理,加工的產品.如各種目錄,索引和文摘,或各種書目型數據庫. 4)三次文獻:在一次,二次文獻的基礎上,對有關知識信息進行綜合,分析,提煉,重組而生成的再生文獻.如各種教科書,技術書,參考工具書,綜述,年鑒,手冊等.
二、信息檢索的重要意義主要體現在以下兩方面:
(1)充分利用信息資源,避免重復勞動 科學研究具有繼承和創造兩重性,科學研究的兩重性要求科研人員在探索未知或從事研究工作之前,應該盡可能地占有與之相關的信息,即利用信息檢索的方法,充分了解國內,國外,前人和他人對擬探索或研究的問題已做過哪些工作 取得了什么成就 發展動向如何 等等.這樣才能做到心中有數,防止重復研究,將有限的時間和精力用于創造性的研究中.因此,信息檢索是科學研究必不可少的前期工作. (2)為人們更新知識,實現終生學習提供門徑 在當代社會,人們需要終生學習,不斷更新知識,才能適應社會發展的需求.美國工程教育協會曾估計,學校教育只能賦予人們所需知識的20%~25%,而75%~80%的知識是走出學校后,在研究實踐和生產實踐中根據需要,不斷再學習而獲得的.因此,掌握信息檢索的方法與技能,是形成合理知識和更新知識的重要手段,是做到無師自通,不斷進取的主要途徑.
三、國內文獻檢索工具簡介 1.《全國總書目》和《全國新書目》 這兩種書目創刊于1949年,由國家出版事業管理局版本圖書館編,中華書局出版。 這兩種書目是根據全國出版單位向版本圖書館繳送的樣本書而編成的,是我國的國家書目。它是檢索我國出版圖書的主要檢索工具。用它可查到公開出版的科技圖書和部分內部出版的科技圖書。 2.《全國報刊索引》 它創刊于1951年,由上海圖書館編輯出版,月刊,收錄中央和各省、市、自治區出版的報紙、雜志資料,以題錄形式作報道。通過這個索引,能查到我國主要報刊上的科技論文和資料。該刊從1980年分為科技版和哲學、社會科學版兩部分。每條資料依次著錄篇名、著譯者、刊名、出版年、月及卷、期、頁次。 3.《中文科技資料目錄》和《科技文摘》 《中文科技資料目錄》和《科技文摘》收錄國內公開和內部的科技期刊論文、科技資料和譯文,不收錄密級資料.
四、國外文獻檢索工具簡介
1.《科學引文索引》(Science Citation Index,簡稱SCI),是美國費城科學情報所(ISI)編輯出版的一種綜合性科技引文檢索刊物。。《SCI》報道文獻的學科涉及生命科學、臨床醫學、數理科學和化學、農業、工程技術、行為科學等方面,主要側重于基礎學科。
2.美國《化學文摘》(Chemical Abstraccts,簡稱CA)創刊于1907年,由美國化學學會(CAS)的化學文摘服務處(Chemical Abstraccts Service,簡稱CAS)編輯出版。它是一種享有世界聲譽的化學化工專業性文摘刊物,自稱為“打開世界化學文獻寶庫的鑰匙”。它以報道世界各國化學、化工文獻為主,同時收錄大量生物學、醫學、藥學、衛生學等相關專業的文獻。
3.俄羅斯《文摘雜志》(簡稱Р.Ж.)1953年創刊,它是由前蘇聯全蘇科學技術情報研究所編輯出版的大型綜合性檢索刊物。它收錄世界上130多個國家的66種文字的科技文獻,包括22000多種期刊、10000多種圖書、6000多種連續出版物、15萬件發明證書和專利以及會議錄、科技報告、標準等等。全年報道量約在120萬條以上,是目前世界上引用出版物最多、報道量最大的一套文摘刊物。
4.英國《科學文摘》(Science Abstraccts,簡稱SA),創刊于1898年,是一種物理學、電氣電子學、計算機與控制領域綜合性科技檢索刊物,現由英國電氣工程師學會(下設的“國際物理與工程情報服務部”編輯出版。
五、計算機檢索技術
1.布爾檢索 邏輯“與” (AND),表示為 A and B 或 A * B。表示檢出的記錄必須同時包含所有的檢索詞,可以縮小檢索范圍,減少命中文獻量,提高查準率。
邏輯“或”(OR),表示為 A or B 或 A + B。表示檢出的記錄中至少含有多個檢索詞中的任何一個,可以擴大檢索范圍,增加命中文獻量,防止漏檢。常用于連接同義詞,相關詞等。
邏輯“非”(NOT),表示為 A not B 或 A - B。表示檢索結果中排除含有某些詞的記錄,可以縮小檢索范圍,減少文獻輸出量,但并不一定能提高查準率。
2.截詞檢索
提高查全率,防止漏檢的有力手段。包括有限截詞和無限截詞,常用的有限截詞符和無限截詞符有:*, #,?,!,$
有限截詞--放在詞中間或末尾,一個符號表示一個詞。如:wom*n woman,women 無限截詞--放在司的末尾,一個符號表示任意多個詞。 如:comput! Computer,computers,
注:不同的數據庫所用的截詞符不一樣,使用應先查一下各數據庫的幫助加以確認
3.位置檢索
常用的位置算符有:(W) (nW) (N) (nN)等
(W) W的含義為with,表示其兩側的檢索詞必須緊密相連,除空格和標點之外,不得插入其他詞或字母,兩詞的詞序不可顛倒。如輸入communication(W)satellite時,系統只檢出含有communication satellite的記錄。 (nW)這里W的意思是word,允許兩個檢索詞之間插入最多n個詞,詞序不變。如輸communication(2W)satellite系統將會檢出communication satellite; communication though satellite; communication on the satellite. (N) N的含義為Near,表示兩個檢索詞必須緊密相連,空格標點除外,詞序可以顛倒。 (nN)兩個檢索詞之間可以插入n個單詞,前后位置可以互換。
附:三次信息檢索實驗的心得體會 對于現階段的學習,通過每次的信息檢索實驗掌握幾個基本數據庫的使用方法,知道查文獻可以到哪去查,原文到哪里去索取,我自認為的確是學到東西了,但和鉆研的同學比起來中間還是存在一段差距.這不禁使我對以前的認知態度產生了某種懷疑. 1.檢索的基礎 以前一直覺得,信息檢索是一種手段,存在一定的技巧,我們不可能一蹴而就,掌握得很好,在現階段,跟著老師走,以最短的時間在最大程度上提高檢索能力,是目前"最優化"的方法,只要能制定出相對正確的檢索策略就夠了,至于其檢索能力的進一步提高,可以在以后的學習工作中不斷學習與積累.現在看來這個相對正確,除了不犯not,and,all優先次序的錯誤外,認真分析課題,確定關鍵詞,防止漏檢也是至關重要的.檢索前,不妨先花點時間,用詞典查一下關鍵詞的英文表述,找一本大百科全書是一個不錯的選擇.注意不同的檢索工具間的區別及其特色,并能熟練掌握. 2.檢索與閱讀 沒有消化與吸收的檢索有什么用?檢索與閱讀文獻是科研工作中重要的兩個方面,就像是一個木桶上的兩塊板,一方面的薄弱,都會導致最后盛水量的不足,因此無論是哪方面的缺憾都將制約你的科研工作,只有當兩者和諧發展時,才能發揮出最大的作用.一味地追求某一方面的能力,而忽視另一方面的鍛煉,都是不可取的.信息檢索課程的設置,只能最大限度的提高我們在檢索方面的能力,對于文獻的閱讀,就是"師傅領進門,修行靠自身"了.有目的地培養自己在這方面的能力,文獻閱讀能力的提高,同時還能加深我們對課題的理解,制定出更為合理的檢索策略,促進檢索能力的提高.因此兩者是相輔相成,相互促進的.可能是因為正處在訓練檢索能力的階段吧,我經常會出現這樣的情況,用這個方法那個方法查出來一堆文獻(有的還要去找原文),結果看著著一堆東西,什么都想要去找,找到了什么都想看看,又不知道先看什么,有點像猴子下山,看到玉米掰玉米,又看到西瓜,丟了玉米去摘西瓜……最后什么收獲都沒有.有一段時間甚至還想和師兄比較一下看看索取原文的能力差多少,花了很多時間只想看看能找到多少,找到了,也沒去看過.我想在這樣的過程中,我丟掉的大概是最重要的東西吧! 3.檢索與科研 對于信息檢索,不能把它孤立地以一門課程來對待,只有當它與其它研究聯系起來的時候才能發揮出最大作用.文獻的檢索與閱讀,都是最終和科研聯系起來的.針對索取到一大堆文獻,結果不去閱讀的情況,我覺得,信息檢索應該要分類"勤索",閱讀.就像"書非借不能讀也",存在電腦里的文獻放的時間越長,越不會去讀,還不如每天就課題的某一方面檢索出一定的文章,精心挑選出有價值的(保證在某一期限內可以閱讀完成的,不管是通過精讀還是略讀或者是瀏覽),保存,并嚴格按照計劃閱讀完成.由于該期限內所閱讀的文章都是某一內容的,更有利于我們理解與比較.結合整個科研過程,在還沒有確定課題的時候,我們可能需要了解很多關于某個領域的相關信息,這個時候,不一定是只查閱文獻,還可以看看一些BBS 上關于這個方面的帖子,總之,要盡可能寬的了解這一方面的知識.確定課題后,由于是剛接觸,可以翻閱百科全書等了解一下基本知識,閱讀一些專著,對該領域有一個系統的了解,可以上超星或圖書館的匯文系統查閱這方面的書籍,在此基礎上檢索一些綜述性的文章,了解課題的背景知識,歷史,以及目前的研究狀況等,并逐漸深入.在研究的不同階段有重點的閱讀相關的文獻,從理論,實驗,研究方法,應用各方面建立整體的結構框架,制定實驗方案.在實驗過程中,及時總結實驗結果,不斷調整方案,并不忘對課題進行追蹤.隨著研究的深入,不能只注意深度,仍要不時看看與研究領域相交叉的學科發展等,注意文獻的擴展.當然,我現在還沒有真正開始這方面的工作,寫這些也不過是靠著對研究過程的想象和理解而已,有點紙上談兵的味道,在實際工作中碰到的可能遠比這復雜,并且這種憑空的想象與實際可能還是有很大出入的,說得不對,也別見怪.
4.檢索與生活 此外,信息檢索與我們的生活也息息相關.我們通過檢索更可獲得的不只是文獻以外的內容.用普通的搜索引擎,我們可以找到現實生活中需要的信息,如商品,想下載的軟件,mp3,等等.看了那篇google的應用后,更覺得檢索的方便與實在,應該說,它大大提高了我們從網上獲取有用信息的效率! 5.檢索的不斷完善 或許,現在我們的檢索水平真的是不咋的,但也不要妄自菲薄啊!它還等著讓我們去不斷提高與完善呢!當今世界,存在的檢索工具,絕不止課上講授的這些,而隨著信息技術的發展,我們有理由相信,會出現越來越多的檢索工具,現存的檢索工具也會不斷的完善,這就要求我們不斷地學習與發展,"與時俱進"了.信息檢索這門課程,要傳授給我們的是一種檢索的理念:邏輯運算符的運用,如何查準查全,如何確定關鍵詞,如何搜索……我覺得,無論怎么變,其人性化的設計應該是不變的.或許我們可以從頁面上找到例子,找到"browse""dictionary",找到"limit"這些曾經在其它檢索頁面上看到的東西,觸類旁通. 最后,希望檢索能為我們揚起在科研的瀚海中航行的風帆.
本站部分文章來自網絡,如發現侵犯了您的權益,請聯系指出,本站及時確認刪除 E-mail:349991040@qq.com
論文格式網(www.donglienglish.cn--論文格式網拼音首字母組合)提供其他論文畢業論文格式,論文格式范文,畢業論文范文