Nature|Google Scholar能否在AI发展中幸存下来?

政务   2024-11-23 07:12   湖北  

自:地球平衡与稳态

Google Scholar 这个最大的学术搜索引擎即将迎来自己的 20 岁生日,但人工智能驱动的竞争者们却提供了优势。

已经或即将面临的境遇

本周,最大、最全面的学术搜索引擎谷歌学术(Google Scholar)将迎来 20 周岁生日。一些研究人员说,在过去的二十年里,该工具已成为科学界最重要的工具之一。但近年来,利用人工智能(AI)改善搜索体验的竞争者不断涌现,允许用户下载数据的竞争者也在不断涌现。

西雅图华盛顿大学的计算社会科学家杰文-韦斯特(Jevin West)每天都在使用谷歌学术数据库,他说,谷歌学术(隶属于位于加利福尼亚州山景城的网络巨头谷歌)对科学的影响是巨大的。但是,“如果说谷歌学术作为主要搜索引擎的地位有被推翻的一天,那可能就是现在,因为一些新工具和其他地方正在进行的一些创新,”韦斯特说。

西班牙格拉纳达大学(University of Granada)文献计量学研究员阿尔贝托-马丁-马丁(Alberto Martín Martín)说:“谷歌学术的许多优势--免费访问、广泛的信息和复杂的搜索选项--现在正被其他平台所分享”。

人工智能驱动的聊天机器人,如 ChatGPT 和其他使用大型语言模型的工具,已经成为一些科学家在搜索、审阅和总结文献时的首选应用。一些研究人员已经将谷歌学术(Google Scholar)换成了它们。“新加坡管理大学(Singapore Management University)的学术图书馆员 Aaron Tay 说:"直到最近,谷歌学术(Google Scholar)还是我的默认搜索。但 “最近,我开始使用其他人工智能工具”。

尽管如此,考虑到谷歌学术的规模和它在科学界的根深蒂固,“要废黜它需要付出很多努力”,韦斯特补充道。

谷歌学术研究项目的联合创始人阿努拉格·阿查里亚(Anurag Acharya)表示,他欢迎所有让学术信息更容易找到、理解和发展的努力。“我们能做的越多,对科学的进步就越有利。”


更新、扩大学术影响力

Google Scholar在2004年出现在文献搜索领域,改变了一切。当时,研究人员使用图书馆查找信息或通过访问付费在线服务(如科学引文数据库Web of Science)搜索学术论文。另一项付费服务与谷歌学术在同一个月推出-爱思唯尔的Scopus,一个大型的科学参考文献和摘要数据库。

Google Scholar在网络上抓取任何类型的学术作品,如书籍章节,报告,预印本和网络文档-包括英语以外的语言。Acharya说,其目标是“使世界上的研究人员更有效,帮助每个人都能够站在共同的科学前沿”。

谷歌学术与出版商的协议使其能够无与伦比地访问付费墙后的文章全文-而不仅仅是标题和摘要,这是大多数搜索引擎提供的。它根据论文与搜索查询的相关程度对论文进行排名-通常将引用最多的文章放在首位-并建议进一步的查询。它的覆盖面很广,便于进行高度具体的搜索。

谷歌拒绝分享该服务的使用数据,但根据网络流量计Similarweb,谷歌学术每月的访问量超过1亿次。

Martín Martín说,该数据库还非常善于为人们提供文章的免费版本。位于科尔多瓦的西班牙国家研究理事会高级社会研究学院的文献计量学家何塞·路易斯·奥尔特加说,这促进了开放获取运动。

但在其他方面,谷歌学术是不透明的。其中一个关键问题是缺乏对它搜索哪些内容(包括哪些期刊)以及它用来推荐文章的算法的了解。它还限制其搜索结果的批量下载,这些搜索结果可用于文献计量分析等。“我们对科学中最有价值的工具之一没有太多了解,”韦斯特说。

阿查里亚说,谷歌学术主要是一个搜索工具,其主要目标是帮助学者找到最有用的研究。

更新引擎

   在过去的几年里,已经出现了提供这种文献计量学数据的竞争对手,尽管没有人能击败谷歌学术的规模和付费墙后的全文文章。一个值得注意的例子是2022年推出的指数OpenAlex。前一年,微软学术图表,抓取网络学术信息,已经停止,其整个数据集发布。OpenAlex建立在这个和其他学术数据的开放来源之上。用户可以搜索它按作者、机构和引文分类的内容,也可以免费下载它的全部记录。“他们正在做我们希望谷歌学术做的事情,”

另一个流行的研究工具Semantic Scholar于2015年推出,它使用人工智能创建可读的论文摘要,并识别最相关的引文。另一个工具Consensus于2022年推出,它依赖于Semantic Scholar的数据库来寻找研究所提供的问题的答案(West是Consensus的顾问)。Tay最喜欢的一个是Undermind,它使用更复杂的基于代理的搜索,其中一个自治实体像人类一样扫描科学文献,根据它找到的内容调整搜索。它需要几分钟-而不是谷歌学术几秒钟-吐出结果,但泰说,等待是值得的。“我发现回来的结果的质量比谷歌学术更好。”
Acharya表示,Google Scholar还使用AI对文章进行排名,建议进一步的搜索查询并推荐相关文章。本月早些时候,该公司将人工智能生成的文章大纲引入其PDF阅读器。Acharya还说,搜索工具试图理解查询背后的意图和上下文。他说,这种语义搜索方法基于语言模型,已经使用了大约两年。
Google Scholar还没有做的一件事是包括人工智能生成的搜索查询答案概述,类似于现在在典型的Google搜索顶部找到的那些。Acharya说,以简洁的方式总结多篇论文的结论并包括重要的背景是具有挑战性的。“我们还没有看到一个有效的解决方案,这一挑战,”

(转载仅供交流学习使用,侵权必删)

投稿、转载、合作、申请入群可在后台留言(备注:姓名+微信号)或发邮件至sthjkx1@163.com

【点击下方超链接阅读16个栏目推文】 

1.【直播】9.【院士】
2.【视频10.【综述】
3.【健康&毒理11.【写作】
4.【12.【Nature】
5.【13.【Science
6.【14.【WR
7.【固废15.【EST
8.【生态】16.【JHM


生态环境科学
最新学术成果与讯息
 最新文章