▲点击图片查看豆瓣高分书籍
公众号后台回复:“豆瓣”,获取豆瓣高分书籍
公众号后台回复:“社群”,进入知识分享社群
热文推荐:
今天分享的报告是《2024大模型训练数据白皮书》,版权归阿里研究院所有。
业界认为,算法、算力与数据,是支撑大模型发展的三大基石。更高质量、更丰富的数据是以 GPT 为例的生 成式人工智能大模型成功的驱动力。
GPT 模型架构从第 1 代到第 4 代均较为相似,而用来训练数据的数据规模和质量却有很大的不同。GPT-1 是由 4.8G 未过滤原始数据训练,GPT-2 是由经人类过滤后的 40G 数据训练,GPT-3 是由从 45T 原始数据中过滤的 570G 数据训练,而 chatGPT/GPT-4 则是在该基础上又加入了高质量人类标注。
以吴恩达(Andrew Ng)为代表的学者观点认为,人工智能是以数据为中心的,而不是以模型为中心。“有标注的高 质量数据才能释放人工智能的价值,如果业界将更多精力放在数据质量上,人工智能的发展会更快”。
报告获取方式
长按下方二维码
回复: 报告
报告地址:
https://pan.quark.cn/s/6dd8f2dd6533
点击阅读原文获取
——推荐阅读——
书籍获取方式
长按下方二维码
回复: 豆瓣
书籍获取方式
长按下方二维码
回复: 豆瓣
干货▶
麦肯锡认知升级三部曲:《麦肯锡方法》《麦肯锡意识》《麦肯锡工具》
PPT▶
影视▶
阅读▶
人民日报书单:100本深度思考书籍,让你脑洞大开(附PDF)
100本哈佛商学院必读书单(附1067页哈佛商学院经典案例)
职场▶
元宇宙▶
ChatGPT▶
互联网▶
数据▶
科技▶
《麻省理工科技评论》:2024 年“十大突破性技术”报告(附下载)
麦肯锡报告:2030年,8亿人被机器取代,近亿中国人面临职业转换(附PDF)
美智库:不应高估中国的科研实力,中国科研存在两大弊病,难以克服
社会
麦肯锡报告:2030年,8亿人被机器取代,近亿中国人面临职业转换(附PDF)
干货▶
麦肯锡认知升级三部曲:《麦肯锡方法》《麦肯锡意识》《麦肯锡工具》
PPT▶
影视▶
阅读▶
人民日报书单:100本深度思考书籍,让你脑洞大开(附PDF)
100本哈佛商学院必读书单(附1067页哈佛商学院经典案例)
职场▶
元宇宙▶
ChatGPT▶
互联网▶
数据▶
科技▶
《麻省理工科技评论》:2024 年“十大突破性技术”报告(附下载)
麦肯锡报告:2030年,8亿人被机器取代,近亿中国人面临职业转换(附PDF)
美智库:不应高估中国的科研实力,中国科研存在两大弊病,难以克服
社会
麦肯锡报告:2030年,8亿人被机器取代,近亿中国人面临职业转换(附PDF)
扫码进入知识分享社群
分享优质内容,让阅读有价值
愿行者智,并智者行
公众号后台回复 “社群”, 加入社群