千呼万唤始出来!
自从以ChatGPT为代表的AI大模型面世以来,基于大模型的垂直应用也如雨后春笋般迅速崛起,蓬勃发展。但是在科研领域,除了一些简单的在线工具以外,鲜有成熟的产品。投必得和硅谷公司Techlent强强联合,基于GPT,Claude等大模型和提示词工程于今年七月份成功开发出“投必得AI英文润色”工具。
2024年11月,投必得中国区总负责人曹鸿萍携该产品参加“百模论剑·首届全国人工智能+行业应用创新大赛”,并一举斩获全国三等奖。该款工具可以大大提高科研人员的工作效率,降低成本,提高科研工作者的产出。
2024年12月12日,“投必得AI英文润色”工具在投必得官网正式上线!即日起,新用户注册即可免费试用1000词。请认准官方网址:
https://ithenticate.topeditsci.com/
七款AI润色工具综合测评!
不卖关子,直接上测评结果:从语法句式、基本逻辑的润色,到修改稿的格式和修改痕迹的保留,再到修改时间、价格等多角度,“投必得AI润色工具”的综合排名是当之无愧的第一名!接下来我们先展示测评的第一大部分,也是最重要的部分:文章语言和基本逻辑的修改。
测试稿件(野生型Wild Type):
四篇稿件,三篇标准润色水平,一篇深度润色水平稿件(稿件水平的分类是按照投必得人工润色服务的标准来进行的,该分类主要是用于区别文章原稿的写作水平)。四篇稿件的专业领域分别为临床医学,植物学,工程学,社会科学。
测试标准(对照组Control):
大家以前也看到过很多润色工具测评,但大家有没有发现,那些测评大多是几个工具间的横向比较。但在科学逻辑上,这并不能说明任何问题,因为缺乏一个公认的优质对照。而投必得作为深耕论文服务行业多年的团队,在这方面具有天然的优势,我们所有的测评以及开发都是以人工最优秀编辑的水平为标准。所以大家看到以下测评结果时,最多会看到九组结果:包括原始稿件,人工修改后稿件,以及七款工具修改后的稿件。
测试产品(实验材料Materials):
我们共选取了市面上七款润色工具产品,基本上囊括了大家常用的英文论文润色软件。根据产品上线的时间以及它们所用的技术,我们将七个产品分为了三类:
前GPT时代产品:Pa***,Cu***,Wr***,Gr***
GPT时代产品:GPT-4
后GPT时代:Re***,投必得AI润色
由于本测评涉及到产品横向比较,虽然我们立求客观,但毕竟是一家之言,所以为尊重其它同行和相关产品,测试所用产品名称均用前两个字母代表。我们稍后也会公布一些产品单独测试的完整报告,有兴趣的小伙伴敬请期待。
测试指标与结果:
总修改率是GPT时代和后GPT时代工具区别于前GPT时代产品的最明显特征。具体来看,GPT-4修改率最高,以45.2%傲视群雄,但这个远高于人工编辑的修改率并不代表优秀,反而说明其存在过度修改的问题。
投必得AI润色的总修改率次之,但是最接近人工编辑的修改率,二者都在25%左右;之后是Re****,跟人工编辑的修改率也比较接近,达到17.5%;最后是前GPT时代的四个产品,总修改率远低于人工编辑,均低于15%。
投必得多年的润色编辑经验证明对于大多数稿件来说,经过人工修改以后,全文的删减率会在5%左右,因为高级编辑一般都倾向于使文稿更加简洁流畅,所以修改后的文稿字数比原稿要略少一些。
从我们的测评来看,前GPT时代的四款产品的删减率在-1%到1%之间,相当于基本没有改变全文字数,这跟它们的修改率比较低有很大关系。而GPT-4仍然“傲视群雄”,以27.8%高居第一,这个又再次证明,GPT-4存在明显的过度修改(删减)的问题。而两款后GPT时代产品的删减率更接近人工编辑的修改结果,但也可以看到,仍然是高出约2~2.5个百分点。说明跟人工润色比起来,这两款工具仍然存在一定程度的冗余修改,但并不多,属于可以接受的范围。而且通过我们更细致的分析,这些冗余修改,并不是修改错误,而是属于低价值修改,详见第三点测评。
从结果中可以看到GPT-4在这方面是最薄弱的一环。尤其是在论文的讨论部分,一般的科技论文写作其实多多少少有“八股文”的倾向,会先描述前人研究的结果,再描述本文结果,最后再比较二者,得出本文研究的独特之处。这对于GPT-4来说,语言就过于啰嗦,我们测试的四篇文章中,有三篇文章的讨论部分被删减了20%~50%,另一篇被删减了14%左右。
上面说到GPT-4的总修改率最高,但它最大的问题是明显存在过度修改(也包含过度删减)的问题,为了克服这个问题,投必得AI润色利用提示词工程成功地降低了无效或者低价值修改/删减。所以我们可以看到,投必得AI润色工具的高价值修改比例(89.2%)远大于GPT-4的相应比例(67.3%)。
注:高价值修改代表那些有语法等错误的修改或者那些可以明显改善语言结构和逻辑的修改;低价值修改则代表那些使文章语感更流畅,用词更“高级”,但可改可不改的修改。
随着各种AI工具在科研中的应用,AI内容检测率也已经成为很多期刊在稿件初审中必经的一步。经投必得AI润色后的稿件,AI检测率大大低于GPT-4工具,在测试的四篇稿件中,只有一篇稿件的AI检测率为33%。其余三篇均未被Turnitin 的AI检测产品检测出有AI痕迹。而经过GPT-4修改的文章,三篇都被检测出了较高的AI检测率。所以经过投必得AI润色的稿件,大概率是没有AI修改痕迹的。当然,如果待投的期刊对AI修改有明确的要求,最好还是要查一下AI检测率。
另外,需要指出的是,本次测试的四篇稿件原稿是没有经过任何AI工具辅助写作的,所以如果原文已经用过其它的AI写作辅助工具,然后再用投必得AI润色工具进行润色,那么大概率是会被检测出AI痕迹的。
实际修改案例展示
参与我们前期调研的老师大多希望我们列举一些修改实例,一来让大家直观的感受一下投必得AI润色工具的修改能力,二来也了解一下该工具都会对哪些内容进行修改。下面我们就找了比较简短的一段作为示例,虽然简单,但是AI润色工具在多方面多角度对原文进行了修改。
However, the overproduction of excessive ROS may production can lead to oxidative stress that can damage some, potentially damaging cellular compounds including components such as proteins, lipids, carbohydrates, and nucleotides of plant cells, and beneficial for the, which may benefit necrotrophic pathogen pathogens that brings harm to its hosts their hosts27-29.
“overproduction of ROS”被改为“excessive ROS production”,使用“excessive”更符合学术语言习惯,简洁且正式。
“some cellular compounds including”被替换为“cellular components such as”,避免了“some”的模糊表达,“components”更加正式且适合科学语境。
原文中的表达较为冗长,例如“may lead to oxidative stress that can damage some cellular compounds including proteins, lipids, carbohydrates and nucleotides of plant cells”。编辑后的版本通过移除“that can damage some cellular compounds...of plant cells”直接使用“potentially damaging cellular components such as...”进行了精简,使句子更加紧凑流畅。
编辑后的句子通过“which may benefit necrotrophic pathogens that harm their hosts”直接指出ROS过量对致病菌的潜在益处,使因果关系更清晰明确,而原文“and beneficial for the necrotrophic pathogen that brings harm to its hosts”显得关系较松散。
原文中的“of plant cells”是多余的,因为在上下文中已经明确讨论植物细胞,编辑后删去了这部分以避免重复。
投必得AI润色工具具有以下三大特色:
✅比拟人工编辑的强大AI润色工具,接近直接投稿水平
✅5分钟一键下载,高效返稿无需等待
✅低至2分钱每词,实现最高性价比
值此正式上线的机会,我们特推出大幅优惠活动,除所有新客户均可享受1000词免费体验外,只要在线提交稿件或预购,都可以直接享受半价优惠!一篇5000词的文章,2000不要,1000不要,500不要,仅需百元!
速来投必得AI润色官网体验吧!
https://ithenticate.topeditsci.com/
关于我们:
投必得总部位于美国高校云集的学术重镇华盛顿DC地区,拥有各个学科领域专家上千名,在过去十年间积累了数万篇稿件修改经验。Techlent总部位于美国IT公司云集的科技重镇加州硅谷,具有最前沿的AI工具开发能力和经验。
两家公司基于双方在学术论文编辑和AI垂直应用方面的经验,强强联手,开发出可以比拟人工编辑水平的高效AI润色工具,帮您大大提高科研工作效率,降低成本,提高成果产出!