|
想像一下你搜索因特网时,能够将你的搜索结果局限在学术文本范围内。今天Google就发布了一个免费搜索引擎,可以为你完成此项任务。Google
Scholar搜索的范围限于学术研究方面,各个领域的学术期刊文章,学位论文,专著,科技文章的预订本以及科技报告。
该引擎的测试版位于http://scholar.google.com
,你可以开始试用了。举个例子,检索词组“humangenome”时,一般的网页搜索引擎返回大约450,000笔结果,基因研究中心(genome
center)和基因库(databases)以及其它网站被排在首位。与此不同的是,Google Sclolar只返回113,000项结果,排在前列的结果不是网站名称而是该主题方面的有重大影响的文章。事实上,排在第一位的文章是一篇发表在2001年Nature上,具有划时代意义的文章“Initial
sequencing and analysis of the human genome”。
基于链接
该引擎的工作原理和一般的网页搜索引擎相似。最初的搜索引擎利用网页之间的链接来进行计算,这成为最有用的参考。指向链接多的网页就当做权威的网页,进而被排在搜索结果的首位。在考虑网页链接来源的重要性的基础上,对以上结果进行重新筛选排序。Google的共同开发者Sergey Brin说,“我们不仅仅考虑链接的数量”。他进一步解释道,“来自Nature首页的链接就比来自我的首页的链接重要。”
Google Scholar的工作原理非常类似,它利用每张网页末尾的引用而不是网页链接。Google
Scholar自动从网上识别科技文本的格式和内容,并自动抽取参考文献,为所有索引的网页建立自动引用分析。
该方法在计算机科学方面处于领先地位。运用信息技术公司NEC生产的Research Index进行。
成功的检索
通过一家名为CrossRef Search出版集团的导航搜索引擎,包括自然出版集团(Nature Publishing
Group),计算机协会(the Association for Computing Machinery)和电力及电子工程师学会(the
Institute of Electrical and Electronics
Engineers)在内的出版商向Google提供很多经过专家评审过的出版物。
出版商通过处理,让Google自动搜索引擎检索他们的全文。用户点击Google
Scholar返回的链接可以导向出版商网站上的文章,已经预订的用户可以使用全文,而非订户可以浏览摘要或者如何购买该文的信息。
Google Scholar仍然有其突破性的特征。每一笔检索结果同时也指向Google
Scholar找到的,那些保存在其它网站上的免费版本,比如个人网站上。(贺文照 译)
原文见:http://www.nature.com/news/2004/041115/full/041115-13.html
|