搜索煮译 | 搜商飞跃:掌握搜索引擎高级语法,信息检索快人一步!

文摘   2024-11-03 00:14   陕西  


1. 工具简介


网络科技的迅速发展带来了社会新信息量的剧增,人们的信息资源空前丰富。与此同时,海量信息也使得有效信息的获取成为难点。搜索引擎可以从各种网络资源中浏览和检索需要的信息。随着网络科技和搜索技术的日新月异,搜索引擎已经成为影响人们生活的重要网络应用工具。


以谷歌为例,搜索引擎的工作原理类似,大致可以分为爬虫、索引、搜索、排序四个阶段。所有的搜索引擎都是基于网络爬虫。在爬虫抓取到信息后对这些信息进行提取,分类以及筛选。但是爬虫并不是所有信息都可以获取,它需要遵守robots协议,也就是网站所有者会规定哪些信息是允许爬虫获取,哪些信息是不允许被抓取的。


但是很多人都只会普通的搜索,如果需要更加精准的信息,那么可以考虑使用高级搜索。本文以Google为例向大家介绍主要的搜索引擎语法。


2. 图文教程


2.1 基本搜索

 

1)Google不需要明文使用“+”来表示逻辑与操作,只需要空格就可以了。Google默认的连接符就是AND。这表示如果不加任何修饰符号直接搜索的话,Google就会对所有的关键字进行搜索。

示例:搜索包含关键词“wow”和“gold”的英文网页。

搜索“wow gold”的结果



搜索“wow+gold”的结果



我们可以看到搜索时加不加“+”,搜索结果是完全一样的。


2) 精准搜索:为搜索的关键词打上英文的双引号

在我们明确知道自己要搜索的内容是什么的时候,如果直接搜索,搜索引擎往往会自动把我们要搜索的内容拆分开,甚至会出现一些不相关的内容。



如图所示我们可以看到,直接搜索人工智能,搜索的结果不全是“人工智能算法”,搜索引擎将人工智能和算法两个关键词分开来了,出现了人工智能和算法这两者的搜索结果。此时,如果我们想要精准的人工智能算法的搜索结果,那么我们只需要将人工智能算法打上引号,这样就可以使得检索结果完全匹配搜索内容。要注意,引号必须是英文状态下的引号。下面看一下搜索结果。



从上图我们可以看出,搜索结果中人工智能算法这一整个关键词,没有被分开。这也是在我们日常生活中应用比较广泛的一种方式。


3)排除关键字

在搜索时,使用空格加减号可以拍出不需要的关键字。下面我们以苹果的搜索为例。如果我们想搜索水果苹果,那么在搜索时就去掉手机,电脑和平板三个关键字。搜索结果如下所示。



但是我们从搜索结果中可以看到,并没有完全过滤掉Appl这个电子产品,依然有相关结果出现。广告是非常强大的,无论如何排除关键字,搜索时都会出现苹果公司的广告。


4)OR逻辑搜索

有时候,用户也不知道自己准确的需求,想同时搜索几个关键词,但是又不希望他们互相影响结果,这就需要用户使用大写的OR连接关键词,并用空格隔开进行搜索。下面我们用数据清洗和数据分析的搜索为例:



从搜索结果中就可以看出,页面会同时显示数据清洗和数据分析的结果,两个关键词并不会相互影响。


5)模糊搜索

当你想不起一个完整的搜索内容的时候,直接搜索已知的部分会导致结果不准确,这时候我们可用星号占位来代替想不起来的内容。下面我们用乌克兰*音乐学院为例:



我们可以看到搜索结果都是乌克兰的音乐学院,用户可以从中挑选自己印象中的那个结果。

 

2.2 进阶技巧

 

1)Filetype

在搜索内容后面加上filetype:,然后加上需要检索的文件类型。例如,如果我想搜一本关于人工智能的书的话,我只需要在搜索框内键入:Artificial Intelligence filetype:PDF。下面是搜索结果:



这样就可以找找网络上所有跟人工智能相关的PDF文件,而且能搜出来的内容都可以直接点开下载。对于需要找资料的人来说是一个不错的选择。Filetype的类型也可以是常见的PPT、doc等格式。


2)Site

在搜索内容后面键入site:,然后输入想搜索的网址。Site是利用搜索引擎筛选制定的某个网站的内容。

例如哔哩哔哩和知乎,这些网站都提供了站内搜索的功能,但是很多网站没有站内搜索的功能。因此site这个功能,主要是针对没有站内搜索的网站,或者搜索出的内容不够完善。

例如我需要在教育部的网站搜索研究生相关的内容,那么我们可以利用site功能,在搜索研究生时,在后面加上site:moe.edu.cn。



我们可以看到所有的结果都是教育部网站中关于研究生的内容。需要注意的是不要在冒号后面加空格。


3)inurl和allinurl

在搜索内容后面键入inurl:&allinurl: 然后输入相关URL后缀。

Site是在指定网站搜索,如果我们需要在多个网站搜索,那么我们就可以使用inurl方法了。Inurl就是通过网址URL中的信息来筛选搜索结果。例如如果我们想在中国政府相关的网站中搜索关于民法典的内容,而中国政府相关网站的后缀都是gov.cn。我们可以输入民法典 inurl:gov.cn。下面我们看一下结果:



搜索出来的结果都是各级政府网站中关于民法典的内容。

如果我们想在电影网站搜索一些电影资源,那么可以用inurl: video movie 筛选搜索结果,我们就可以得到网址中包含movie或者film的结果。Allinurl:video movie的搜索结果则比inurl的搜索结果的范围小很多。它表示网址中必须包含movie和film。


4)intitle和allintitle

在搜索内容后面键入intitle:或者allintitle:,然后输入相关标题。

在浏览器进行搜索时,我们可以看到每个标签页都有自己的标题,这个标题也就是所谓的title,每个搜索结果显示的也是和这个页面的title。假如我想搜索Artificial Intelligence intitle:Stanford,结果如下:



我们可以看到搜索结果的标题中包含着Artificial Intelligence和Stanford。


5)define

直接砸搜索引擎中输入define:,然后输入需要查询的名词。

当你需要一个名词的准确定义,又没有词典时,我们就可以用这个方法来进行查询。这样搜索引擎就能给出这个词的定义。下面给出例子:搜索define:Artificial Intelligence



3. 学习心得

 

通过学习Google的高级搜索,获得了许多关于Google的搜索技巧,提高了搜索的精准性,更能获得自己想要的信息。不仅是谷歌,其他搜索引擎也有类似的搜索方法,在日后的学习生活中也要用这样的技巧提高精准度。


4. 配套视频

 


特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。


转载来源:翻译学习共同体

转载编辑:付娟

审核:程海东  代霄彦


资讯推荐

大语言模型技术发展图景



文章推荐

收藏|翻译专业学生翻译技术学习推荐书目


【01】听说Perplexity改变外语教育?你会用吗?

【02】Microsoft Office和WPS中大语言模型插件初探

【03】国内大语言模型对比——基于翻译问题或翻译案

【04】教你如何使用 Copilot 

【05】ChatGPT 和 Gemini 达到专八水平了吗?

【06】国外主流翻译APP

【07】国内主流翻译APP工具

【08】在Trados中利用TM做预翻译

【09】平行语料库在口译实践中的应用

【10】语料库探索之语料对齐及分词赋码

【11】语料处理之语料采集与清洗 

【12】如何创建应用于Trados的术语库?

【13】如何使用Trados建立翻译记忆库?

【14】国内外常见语料工具一览

【15】翻译人员不容错过的5个权威术语库

【16】国内外常见CAT工具一览

【17】AntConc简介及索引工具介绍(一)

【18】Quicker使用技巧

【19】Everything:一款“秒”搜文件的神器

【20】Sketch Engine探索第一弹来袭!

【21】LancsBox:语料库研究者的必备工具

【22】TermWiki:术语检索利器

【23】ABBYY FineReader PDF:文档识别小帮手

【24】ChatGPT + Word = 高效办公

【25】如何利用聊天机器人制作双语术语表

【26】 ChatGPT在译前准备中的应用——术语准备

【27】投喂语料,提升译文质量

【28】(一)结合ChatGPT的译前编辑初探

【29】ChatGPT最新接入word方法(完美debug)

【30】AI外语写作助手,助力高效写作

【31】探索ChatGPT在翻译过程中的应用

【32】中科院学术优化本地部署


如您喜欢我们的内容,欢迎您点赞、在看、转发,更多问题可后台留言小编哦



翻译技术教育与研究


科普翻译技术知识

推动翻译技术应用

促进翻译技术融合研究


    后台留言,小编会尽快回复





翻译技术教育与研究
科普翻译技术知识,推动翻译技术应用,促进翻译技术融合研究。
 最新文章