第7章 后續工作
在獲得了別人對一篇論文的評論以及這篇論文基于影響力的概括之后,我們可以對這兩段話做更多的分析,獲得更好的效果。
例如,可以對基于影響力的概括進行分類[Nanba, et al.,2004],分成定義和實現這兩大類,這樣,可以更加清晰的了解一篇論文的重點。我們還可以對獲得的這些評論進行聚類。獲得的這些評論中,會有一些意思相近的句子,如果最終都出現在我們的評論段落里,那肯定不利于了解源論文更多的信息。在[Qazvinian and Radev,2008 ]這篇文章里,就是給定了一些評論句子之后,從中找出一些子句集,以更簡短的語句更好的將評論表達出來。
還有,我們獲得的這些評論以及概括,都是對于一些相對于老的論文比較有效,而對于較新的論文,顯然易見,它的被引用次數會很少,很難獲得評論,似乎這個系統對這些論文就沒有什么作用 了。但是實際上,我們可以利用自己的系統,對這些新來的論文進行評價。如,一篇會議剛剛接收了一篇新論文A,它引用了一個老論文B,我們可以獲得B的評論 以及概括commentB和impact-basedsummaryB,而A中如果有一句話s對B進行了評論,那么,就可以通過s與commentB以及 impact-basedsummaryB之間的關系,判斷s這句話是好是壞。對A的每一個引用都進行上述過程,那么,最終,可以自動判斷這篇新論文A的質量如何。
在對獲得的那些評論以及基于影響的概括進行打分排序時,可以利用到一些那些評論的作者以及發表的會議等先驗知識。顯然,當一篇論文的作者較有知名度,發表的會議等級較高時,那么引用它的論文的評論要更加具有專業性。
此外,關于論文的檢索部分,學術檢索有其自己的特點。和Web search不一樣,學術檢索一篇文本的長度非常之長,因此文獻頁很多,一個查詢詞來了,可能第一個詞在第一頁,第二個詞在最后一頁,實際不相關,卻作為相關結果返回了,因此,可以利用基于對象的語言模型[Nie, et al.,2007],來改進搜索的效果。
第8章 致謝
還有不到兩個月,就要離開北京大學了,現在想來,還真的有一點傷感。時間過的真的非常快,現在想起來,2005年9月坐著大巴車從五四路進入北大校園的那一刻還歷歷在目。那一刻,是我一生中最開心,最激動的一個時刻之一。能夠進入北京大學學習,是多年的夢想。身上承載著家鄉鄰里的祝福,承載著兄弟姐妹、同學的羨慕,承載著家庭的希望,更重要的是,實現了自己的夢想。直到現在,每每想到進入校園的那一刻,就忍不住的激動起來。
四年的大學生活,以這次的畢業論文為完結,要感謝的人很多很多。首先,我要感謝我的父母,雖然大學之后半年才能見一次面,但那里還是自己的避風港,不論遇到了什么挫折,有他們在背后支持,安慰自己,心里就會感覺踏實了很多。
然后,我要感謝我的班主任張海洋老師和導師閆宏飛老師。張老師幫助我解決了很多的難題,無論是申請出國、實習,還是平時生活中遇到的點點滴滴的事情,她都不厭其煩的幫助我們。大三大四在網絡實驗室實習期間,有很多時候都很沒有自信,對自己的前途很擔心,但是通過和閆老師的談話讓我感受到了網絡實驗室的溫暖。
我還要感謝何靖師兄。在網絡實驗室實習期間,除了鍛煉了自己的編程能力之外,我覺得對我人生影響最大的就是何靖師兄了。跟他在一起工作、學習時,會不自覺的被他所感染,學到很多東西。從他那兒,我學會了以編程為樂,不再像大一大二那樣把編程當作完成任務;從他那兒,我學習到了踏踏實實做學問的精神,一個博士生,能堅持每天7點到實驗室晚上11點回去,這種持之以恒的精神讓我畢生難忘;從他那兒,我還學習到了每天堅持定計劃,晚上做總結的好習慣,這不僅在學習上,對以后的工作、生活等每一件事情都有著重要的意義。
當然,還要感謝單棟棟、趙東升、涂啟琛師兄,他們每一個人身上都有著天網的精神:踏踏實實做學問,以編程為樂。
最后,我還要感謝我的女朋友何蓮同學。進入大二以后之所以能獲得這么好的成績,有一半要歸功于她的監督;特別要感謝在我做手術那幾個月期間,她對我無微不至的照顧,這就是患難見真情吧,每當想起這些,我總會非常感動。
參考文獻
[Croft, et al.,2009] B. Croft, D. Metzler, and T. Strohman, Search Engines: Information Retrieva l in Practice: Addison Wesley, 2009.
[Elkiss, et al.,2008] A. Elkiss, S. Shen, A. Fader, G. Erkan, D. States, and D. Radev, "Blind men and elephants: What do citation summaries tell us about a research article?," J. Am. Soc. Inf. Sci. Technol., vol. 59, pp. 51-62, 2008.
[Mei and Zhai,2008] Q. Mei and C. Zhai, "Generating Impact-Based Summaries for Scientific Literature," presented at Proceedings of the 46th Annual Meeting of the Association for Computational Linguistics (ACL '08). 2008.
[Nakev, et al.,2004] P. I. Nakev, A. S. Schwartz, and M. A. Hearst, "Citances: Citation sentences for semantic analysis of bioscience text," presented at Proceedings of ACM SIGIR'04 Workshop on Search and Discovery in Bioinformatics, Sheffield, UK, 2004.
[Nanba and Okumura,1999 ] H. Nanba and M. Okumura, "Towards Multi-paper Summarization Using Reference Information " in Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence Morgan Kaufmann Publishers Inc., 1999 pp. 926-931
[Nanba, et al.,2004] H. Nanba, N. Kando, and M. Okumura, "Classification of research papers using citation links and citation types: Towards automatic review article generation," presented at Proceedings of the 11th SIG Classification Research Workshop, 2004.
[Nie, et al.,2007] Z. Nie, Y. Ma, S. Shi, J.-R. Wen, and W.-Y. Ma, "Web object retrieva l," in Proceedings of the 16th international conference on World Wide Web. Banff, Alberta, Canada: ACM, 2007, pp. 81-90.
[Qazvinian and Radev,2008 ] V. Qazvinian and D. R. Radev, "Scientific paper summarization using citation summary networks " in Proceedings of the 22nd International Conference on Computational Linguistics - Volume 1 Manchester, United Kingdom Association for Computational Linguistics, 2008 pp. 689-696
[Volkert,2005] L. G. Volkert, "The Science and Art of Literature Searching for Computer Science Research," 2005.