微软千万美元投资，购买学术论文训练AI；显然，IT工程师并不了解，生物医学领域有超大量的垃圾文章。。。

学术 2024-12-20 07:37 美国

Bringing medical advances from the lab to the clinic

关键词：生成式AI；学术出版；内容授权；数据训练；Nature

随着生成式AI技术的迅速发展，大型语言模型（LLMs）作为AI工具的核心，需要大量的数据来训练和优化。

在大众的普遍印象中，学术出版物是质量极高的AI训练源。微软公司也是如此理解，并于2024年7月即爆出与Taylor & Francis出版集团的商务合作，用其学术论文于AI训练【1】。

🔷 显著的经济收益和新的商业模式：

实际上，学术出版商与科技公司之间的合作日益增多，它们通过授权协议允许后者使用学术内容来训练大型语言模型（LLMs），这一趋势带来了显著的经济收益。

在Informa（Taylor & Francis的母公司）与微软签订的这项价值千万美元的协议中，Wiley从与一家未具名的AI模型开发公司签订的协议中获得了2300万美元的收入，并预计本财年将从此类协议中再获得2100万美元。

这些合作关系不仅限于一次性交易而是长期战略，一些出版商正在创建新的部门和项目，以更深入地与技术公司合作开发AI应用。

🔷 作者权益的考虑：

但从项目公布的7月份开始，这个项目就受到了版权机构的关注。他们要求，出版商采取措施，确保在与AI开发者达成正式协议的过程中，作者的权益得到保护。

例如，Taylor & Francis表示将向作者支付版税，并在AI合作协议中设置了严格的界限，确保数据和内容仅用于训练，且不会被复制。

同时，一些出版商已经实施了措施，防止AI工具在未经许可的情况下从网络上抓取其内容。另一些出版商已经开始更直接地与作者沟通，让他们了解内容授权给AI开发者的好处，并在一些情况下获得了作者的明确同意。

图. 微软与Taylor & Francis出版社达成1000万美元的协议，利用其的论文训练其AI系统

IT工程师所不知道的内情：

IT工程师显然忽略了学术出版物的大量学术不端。目前已经披露的信息中，尚未见到对有问题论文的关注。

“问题论文”比例有多高呢？我们做过大数据分析。而近期Nature发布了针对Cochrane数据库中meta分析的研究，结果更是触目惊心。

由 60 多名研究人员组成的团队仔细研究了 Cochrane 组织发表的 50 篇系统评价，他们对审核论文中 25％的临床试验“有些担忧”，对其中 6％的试验“严重担忧”。

要知道，meta分析有“证据中的证据”之称，而临床试验是医学研究中设计最科学、最严谨的方式；仍然有这么高比例的研究数据存在问题。

这不由得让我想起好多年前听詹教授讲meta的时候说的“Trash In, Trash Out”。如今，学术论文中充斥着造假、虚构及被编辑过的数据，让我们还如何敢相信由这些源文件训练出来的AI？

2024上半年SCI论文撤稿大数据：中国作者撤稿占到全球的54%！主要涉及这四大原因。。。

Nature：生物医学研究论文撤稿，欧洲作者20年间增长4倍；为啥？

原文链接：

【1】https://doi.org/10.1038/d41586-024-04018-5

【2】 https://www.nature.com/articles/d41586-024-04206-3

作者：Amber Wang；助理：ChatGPT；编辑：Jessica，微信号：Healsanq，加好友请注明理由。

美国Healsan Consulting(恒祥咨询)，专长于Healsan医学大数据分析（Healsan™）、及基于大数据的Hanson临床科研培训（HansonCR™）和医学编辑服务（MedEditing™）。主要为医生科学家、生物制药公司和医院科研处等提供分析和报告，成为诸多机构的“临床科研外挂”。

网址：https://healsan.com/

更多精彩，点击左下角“阅读原文”。

点击👆；From Bench to Bedside, Healsan Paves the Path.

更多阅读

▼ 临床科研技巧及文献更新。

（点击👆图片，进入自己感兴趣的专辑。或点击“资源”，浏览本公众号所有资源。）

▼ 广而告之。

如果您在从研究结果到撰写SCI论文的过程中，面临语言或编辑的困扰，可以与美国MedEditing的客服沟通，获得帮助。

Hanson临床科研

美国的七位生物医学科学家主持。通过专家讲座，交流医学课题选题思路及SCI论文撰写规范；通过经典论文解读，分享临床科研技巧和突破性进展；通过大数据分析，解析生物医学发展趋势及行业动态。只提供以数据为基础的客观报告，及专业、独立的思考。

最新文章

微尺度超材料：实现声波传播的精确控制

PI3K：热门临床科研靶点大数据分析（2024）

医学生物类SCI论文润色，找我！全是美国本土编辑，八年经验、显著提高论文质量

中国生物制药公司，在境外、尤其是美国找到新出路。。。

【抢课，只剩6个名额】人工智能应用于医学的基金、论文，都呈井喷。这个培训不仅让你理清思路、获得立项依据；还助力完成SCI论文！

国内医生专用：启动绿卡申请前，这个措施让你获批概率倍增！

美国冬假开始，新冠疫情也拉开帷幕

“基于就业”绿卡，内地等待人数比去年同期大幅减少；但“杰出人才”类别，却仍持续增加！（202412）

【模板】以AD中NfL为例，设计疾病生物标记的基金或论文设计思路

微软千万美元投资，购买学术论文训练AI；显然，IT工程师并不了解，生物医学领域有超大量的垃圾文章。。。

【TLR4】临床科研热点，感染、免疫、变性，都在突破（2024大数据分析）

【抢课】新年优惠、六大福利；助你一个月完成一篇SCI论文！仅10个名额，先来先得。

【反义寡核苷酸】大数据分析：技术突破，引发临床科研追逐；基金倍增，高质量SCI论文大爆发（2024）

2型糖尿病患者的肾脏保护新选择：GLP-1 RA与SGLT2i联用，护肾更高效！

招募贤才｜宣武医院神经内科柴国梁课题组招募科研助理2名

长寿的秘诀，被针对“百岁老人”的干细胞研究揭开

【siRNA】终获技术突破！即将引爆新一轮临床科研，这些角度可获得突破（2024）

一文彻底看懂，内地医生如何直接申请到美国绿卡！

81%科学家使用ChatGPT，生物医学领域更为普遍。。。

临床科研热点STAT3大数据分析；中国学者最为活跃，华西医院处于领先（2024）

医学生物类SCI论文润色，找我！全是美国本土编辑，八年经验、显著提高论文质量

“人之初，性本善 or 性本恶”？数千年来思想家的争论，科学家怎么看？首个大样本、多中心研究，为人性论补充上科学证据

科学家求职指南：Nature全球招聘调查精华分享

这些免费资料，为临床科研赋能，让课题思路源源不断、文章持续发表！高质量分析可以发表在SCI期刊！

遭遇厄运，有人“黑化”、有人“归来仍少年”；竟然是由于这个原因！顶刊Science阐述了修复机制

2025年美国移民趋势展望（EB-1A/NIW）

【模板】AI + 真实世界数据 + 临床预后因素 = 创新性研究

大幅提高乙肝表面抗原转阴率！这次由siRNA疗法完成，发表在顶刊“新英格兰医学杂志”

突破“不可成药”，KRAS研究成基金新宠；频发顶刊、屡有突破。医生可以从这几个方面入手（2024）

医学生物类SCI论文润色，找我！全是美国本土编辑，八年经验、显著提高论文质量

CAR-T治疗实体瘤获得实质性突破！IL-15加持、靶向GPC3；发表于Nature

从玄学到显学，去年美国研究经费高达7.1亿美元！肠道微生物大数据分析（2024）

美国华裔到底是什么收入水平？皮尤报告揭开谜底

英国科学家：音乐疗法，对改善痴呆患者生活质量有效！

中国医学院毕业生新移民的最爱：美国超声师（2024）

这些免费资料，为临床科研赋能，让课题思路源源不断、文章持续发表！高质量分析可以发表在SCI期刊！

以乌贼为师，MIT研发出“无针注射”的新型胃肠道生物大分子药物输送系统；研究发表在Nature杂志

Healsan诚招一位在中国内地、擅长医学文献检索的员工

吸烟、高血糖等多种因素均可激发Aβ异常；该靶点研究已经突破AD，走向更广阔领域（2024年大数据分析）

想找到好的科研岗位？Nature职业专栏支招：掌握这些面试问题，轻松拿下心仪offer

Tau研究2024，由AD到糖尿病；靶向免疫疗法正在推进到临床

医学生物类SCI论文润色，找我！全是美国本土编辑，八年经验、显著提高论文质量

脑机接口新突破，精准操控神经活动成为可能；这些疾病将获得治疗上的新进展！

自噬研究更加火爆丨技术快速进化，联合基因编辑取得新突破；中国这些学者成为研发主力！（2024）

还在为医生晋升时的SCI论文烦恼？这个培训，能够帮上你；六份大礼，助力一个月同步完成SCI论文！

诺奖加持、基金新宠、转化热点，大数据分析找到“CRISPR基因编辑”切入点和研究策略（2024）

真是不敢相信，中国人移民美国的首要原因，竟然是这个。。。

NfL变化轨迹：阿尔茨海默病中的神经损伤标志物

美国新冠毒王再次更替；刚果爆发原因未明疾病

美国超声师有大量空缺岗位；这位国内医生，零起点、顺利通过美国超声师SPI考试

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉