百度翻译、有道翻译、谷歌翻译是大众使用比较多的在线或离线翻译工具,当然可以借助国内外开放的大语言模型接口完成翻译任务。作者在采集开源资料以及加工分析中,会涉及众多语言转换,有时候需要在浏览器实时看到翻译结果,有时候需要对保存入口数据批量翻译。以往在浏览器中使用谷歌扩展程序在线翻译,经常遇到梯子不好的窘境。在尝试过这款浏览器插件后,又体验了她的API,与个人需求比较匹配,每月提供的免费字符数也算慷慨,相比百度翻译每月提供5万字符免费使用量,每月有200万免费额度可以满足日常使用。她就是火山引擎。
1、网页插件
按照插件后可在浏览网页过程中随时触发翻译,支持Chrome浏览器、 Edge浏览器、Firefox浏览器。按照官方教程(https://bytedance.larkoffice.com/docx/CMu2dZjXKojmGfxjibscjm2BnJh)安装插件。
使用方式很简单:在网页上点击右键,选择“使用火山翻译”即可。美中不足的是,没办法快速返回原文。
当打开一个pdf网页链接时,会提示是否使用火山翻译打开。选择打开后会在新页面加载pdf,在pdf中选划定文本内容,自动执行翻译。
2、使用API自定义翻译
使用API需要先注册账号并实名认证,https://console.volcengine.com/auth/signup。
登录后在个人控制台中开通机器翻译服务,并生成密钥,使用密钥调用API,结合业务需要应用翻译结果。
from volcengine.ApiInfo import ApiInfo
from volcengine.Credentials import Credentials
from volcengine.ServiceInfo import ServiceInfo
from volcengine.base.Service import Service
class TranApp():
access_key = '***' #密钥Access Key ID
secret_key = '***' #密钥Secret Access Key
lan_source = 'en'
lan_target = 'zh'
#执行翻译
def trans(self, text:list, source:str='en', target:str='zh'):
k_service_info = \
ServiceInfo('translate.volcengineapi.com',
{'Content-Type': 'application/json'},
Credentials(self.access_key, self.secret_key, 'translate', 'cn-north-1'),
5,
5)
k_query = {
'Action': 'TranslateText',
'Version': '2020-06-01'
}
k_api_info = {
'translate': ApiInfo('POST', '/', k_query, {}, {})
}
service = Service(k_service_info, k_api_info)
body = {
'SourceLanguage': source,
'TargetLanguage': target,
'TextList': text,
}
res = service.json('translate', {}, json.dumps(body))
return [x.get('Translation') for x in json.loads(res).get('TranslationList')]