首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

自定义参考Token或将LLM推理速度提高200倍

旅行科技 2024-09-17 09:00 北京

这次LLM 可能要"起飞"了！

Anton Osika 提出了一个惊天动地的创新：自定义参考Token！

这个看似简单的技巧，竟然有可能将LLM的推理速度提高200倍！

你没看错，是200倍！

这意味着什么？

意味着我们可能即将进入一个全新的AI时代！

让我们一起来看看这个"黑科技"到底有多厉害！

什么是自定义参考Token？

简单来说，自定义参考Token是一种压缩LLM输入输出的技巧。

它的核心思想是：用一对特殊的token来表示输入序列中的一段子序列。

具体怎么做呢？

为输入序列中的每个位置分配一个特殊token。
用两个这样的token [x_i x_j] 来表示"从位置i到位置j的所有内容"。

听起来很简单，对吧？但就是这么简单的技巧，却能带来惊人的效果！

为什么自定义参考Token这么强？

想象一下，当LLM需要重写一大段文本，但只需要修改其中几个小地方时会发生什么？

用传统方法，LLM需要重新生成整个文本。但有了自定义参考Token，它只需要：

用一对token引用未修改的部分
生成修改的内容

这能节省多少时间和计算资源？简直是天文数字！

研究者给出了一个惊人的例子：

如果要重写8000个token的代码，但只有5处函数签名需要修改，使用自定义参考Token可以获得约200倍的加速！

自定义参考Token还能干什么？

别以为它只是个加速器，它的潜力远不止于此！

压缩训练数据：通过替换重复出现的子序列，可以大大减少训练数据的大小。
提高训练效率：更小的数据集意味着更快的训练速度和更低的成本。
优化模型性能：通过学习使用这些特殊token，模型可能会变得更加高效和智能。

简直是一石三鸟啊！

怎么训练这个"神器"？

研究者给出了一个简单的训练方法：

对训练数据进行预处理，将重复出现的n-gram（n>2）替换为自定义参考Token。
用处理后的数据训练（或微调）LLM。

听起来很简单，对吧？

为什么这么好的技术还没普及？

Anton Osika 表示，他已经和一些顶级实验室的人交流过，但似乎还没有人实现这个技术。

这就让人不禁要问了：为什么这么强大的压缩技术还没有成为标准呢？

也许是因为：

技术实现上还有一些挑战
大家都在忙着堆更大的模型，忽视了这种优化方法
可能会影响模型的某些能力，需要进一步研究

无论如何，这项技术的潜力是巨大的。它可能会彻底改变我们训练和使用LLM的方式！

你怎么看？它会成为下一个AI领域的革命性突破吗？

👇

👇

👇

👇

本文同步自于知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容，并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

每天约监控6000 条消息，可节省约800+ 小时的阅读成本。
每天挖掘出10+ 热门的/新的 github 开源 AI 项目
每天转译、点评 10+ 热门 arxiv AI 前沿论文

星球非免费。定价99元/年，0.27元/天。(每+100人，+20元。元老福利~）

一是运行有成本，我希望它能自我闭环，这样才能长期稳定运转；
二是对人的挑选，鱼龙混杂不是我想要的，希望找到关注和热爱 AI 的人。

欢迎你的加入！

👇👇👇快人一步，掌控AI👇👇👇

http://mp.weixin.qq.com/s?__biz=MzA4NzgzMjA4MQ==&mid=2453450002&idx=2&sn=e33738cd5225f8cc47cf29e6f27e04c2

关注AGI 的沿途风景！

最新文章

Sam Altman的Worldcoin：用眼睛换币，84%人亏损！

重磅！OpenAI前CTO Murati新团队初具规模！挖角OpenAI成功？

独家解密！Lex Fridman与Anthropic CEO 5小时长谈：Claude 4.0、AGI 2026年或将到来！

再见GPT！你好，「o」！

重磅！AlphaFold 3 终于开源了！

AGI 何时到来？Sam Altman、Dario Amodei、Geoffrey Hinton、Yann LeCun 的时间表

MobA：让AI 真正学会使用手机！

大模型进入瓶颈期，Gary Marcus：我赢了！

OpenAI 新模型Orion 或难产！

Sora 两周内发布！

狂飙！ChatGPT跃升至全球第八大网站！

SpaceX「火星互联网」计划曝光：每秒千万亿比特的星际通信！

惊人发现：LLM模型一半的注意力层是多余的！

重磅！OpenAI迎版权诉讼重大胜利！

Stack Overflow 2024 调查报告出炉：Python将统治编程世界！

重磅！亚马逊欲增资Anthropic：条件是使用自家芯片！

Sam Altman：千日内迎来超级AI，人类将步入丰裕时代

如何使用纯GPT-2解码器进行OCR？

AI艺术之超现实水果！

谷歌研究员François Chollet：AI并非真正的智能，而是一种高级插值

Lepton AI携手DigitalOcean，将大规模GPU稳定性提升至99.5%

AI 逃离人类禁锢的最小规则集是什么？

AI 正在控制你的电脑！

微软AI 部门CEO：自我改进AI 将在5年内实现，人类即将迎来奇点时代！

Perplexity 正以 90 亿美元估值寻求融资！

扎克伯格的核能计划被一群小蜜蜂拦腰斩断了！

特朗普当选，OpenAI将如何应对马斯克？

「Sparks of AGI」作者加入OpenAI，或将推进端侧AGI?

马斯克的Grok API 编程能力大超预期！

ScrapeGraphAI：让自然语言驱动的网页爬虫！

Docling：企业级多格式文档转换的开源工具！

总统大选落幕，五大模型即将发布！

Google用 AI 首次发现 0-Day 安全漏洞！

开源模型将在一年内追平闭源？

重磅！腾讯「混元」亮剑，超越Llama 3.1？

刚刚，OpenAI推出「预测输出」，将模型提速4倍！

Claude 3.5 Haiku来袭！速度飙升、性能超强，唯独……

吴恩达出版免费 AI 电子书——《如何在AI领域建立职业生涯》

RAG九大痛点全解析：从技术选型到成本优化

Reddit 通过AI 实现首次盈利！

Gradio 成为GitHub 最受欢迎的前100 Python 项目

刚刚，X.AI开放Grok API，马斯克每月送你25美元额度！

别傻了，AI并不能让你一夜暴富！

Cursor 开发者的「自定义prompt」曝光

Physical Intelligence 推出通用机器人模型 π₀

SurfSense：你的互联网冲浪记忆管家来了！

重磅！英伟达将入股xAI，估值飙升至750亿美元！

为了让你用好Claude API，Anthropic 发布了5门课程！

Ilya Sutskever：实现AGI需要一具身体吗？

斯坦福推STORM：智能RAG实现复杂研究目标

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉