被抓包,维基百科也用AI生成内容。。。

文摘   2024-10-17 11:25   广东  

最近普林斯顿大学研究团队发布了一项研究报告,指出了维基百科中人工智能生成内容的日益增长需求及其对内容质量、责任归属和偏见放大的影响。使用了GPTZero和Binoculars来衡量维基百科中人工智能生成内容的程度

  结论是,与GPT-3.5发布前的数据相比,近期人工智能生成内容显著增加

研究发现,2024年8月的2909篇英文维基百科文章中有4.36%显著包含AI生成内容。GPTZero标记了156篇文章,Binoculars标记了96篇,二者有45篇文章重叠。被标记的内容通常质量较低,引用较少,与维基百科的知识网络整合较弱。一些文章被识别为自我推销,其他文章则推广业务或个人,通常只包括表面的引用,如个人YouTube视频。有的文章存在对争议性话题的特定观点,还有一些用户利用大型语言模型在真菌、美食和体育等小众主题上创建结构良好的内容以及书籍摘要。

论文还对比了Reddit评论和联合国新闻稿中的人工智能生成内容,揭示了不同的使用和检测挑战。在3000条Reddit评论中,不到1%被标记为人工智能生成,表明这类内容很少见、被审查或难以检测。相比之下,AI生成新闻稿从2022年前的不到1%激增至2024年的20%

论文最后指出,随着生成式LLMs的兴起,人工智能检测工具也在不断进步。如何在不同的情境下评估这些检测器——例如文本长度、领域和人工智能与人类的整合——仍然是一个挑战。

论文还强调了个人、教育工作者、公司和政府需要积极寻求可靠的方法来检测人类创作的内容。现在是全球监管机构提出应对人工智能生成威胁的方法的时候了。

例如,中国正在积极采取措施提高互联网上AI生成信息的透明度。互联网监管机构中国网信办最近发布了一项草案规定,其中包括对人工智能生成内容的标记说明

-https://analyticsindiamag.com/ai-news-updates/around-5-of-new-wikipedia-articles-in-august-were-ai-generated/

END

技能拓展

推介阅读

啥都会一点的研究生
啥都会一点,啥都不精通,自动驾驶感知算法工程师
 最新文章