首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
公众号
互联网持续学习圈
周期
2024年11月
2024年10月
2024年09月
2024年08月
2024年07月
2024年06月
2024年05月
2024年04月
2024年03月
2024年02月
2024年01月
2023年12月
2023年11月
2023年10月
2023年09月
2023年08月
2023年07月
2023年06月
2023年05月
2023年04月
2023年03月
2023年02月
2023年01月
2022年12月
2022年11月
2022年10月
2022年09月
2022年08月
2022年07月
2022年06月
2022年05月
2022年04月
2022年03月
2022年02月
2022年01月
2021年12月
2021年11月
2021年10月
2021年09月
2021年08月
2021年07月
2021年06月
2021年05月
2021年04月
2021年03月
2021年02月
2021年01月
2020年12月
2020年11月
2020年10月
2020年09月
2020年08月
2020年07月
2020年06月
2020年05月
2020年04月
2020年03月
2020年02月
2020年01月
共找到
50
条记录
闭源模型的统治时代将结束?Llama3.1系列模型正式开源,最大405B
文摘
2024-07-24 10:40
上海
Meta Llama 3.1 多语言大型语言模型 (LLM) 集合是一组经过预训练和指令调整的生成模型,大小分别为 8B、70B 和 405B(文本输入/文本输出)。Lla ...
语言模型是如何获得复杂推理能力的?ICML文章给出新的解释
文摘
2024-07-24 10:40
上海
这篇论文探讨了预训练语言模型(LMs)如何通过聚合推理路径来进行复杂推理的问题。作者提出了将LM视为在预训练时聚合间接推理路径的观点,并将其应用于逻辑推理和链式思维推理等重 ...
英伟达又涨了!“中国特供”B20芯片被曝,马斯克豪掷10万块H100训Grok,算力是GPT-4的四倍!
文摘
2024-07-24 10:40
上海
夕小瑶科技说 原创作者 | 付奶茶根据路透社昨日的最新报道,英伟达正在开发一款专门面向中国市场的芯片,型号为B20,这一版本的芯片主要是为了迎合美国现在对芯片出口管制的策略 ...
马斯克又整活了!!!特斯拉明年将内部率先启用人形机器人,目标年产10亿台,售价约2万美元
文摘
2024-07-23 10:22
上海
马斯克表示,特斯拉将在明年小规模生产人形机器人,供特斯拉内部使用,并有望在2026年大规模量产,供其他公司使用。对特斯拉来说,打造出真正有竞争力的机器人,需要顶尖的AI、高 ...
Nvidia提出ChatQA 2,提升LLM的Long Context和RAG能力
文摘
2024-07-23 10:22
上海
近日,英伟达发布了ChatQA 2模型,其想法是弥合开源模型和领先模型如GPT-4-Turbo之间的差距。文中提出了一种训练方法,以有效地扩展 Llama3-70B 的上下 ...
重磅!Llama3.1的405B权重和评测提前泄漏
文摘
2024-07-23 10:22
上海
LLama3 405B的风声已久,此前有小道消息提到:「Meta Platforms计划在7月23日发布其开源的Llama 3模型的最大版本,据一位Meta员工透露。这个版 ...
IMO数学竞赛第5题是何方神圣?大模型全军覆没了…
文摘
2024-07-22 20:40
上海
夕小瑶科技说 原创作者 | 海野昨天,第65届IMO(国际数学奥林匹克竞赛)决赛成绩公布,中国队因2分之差憾失冠军。从中国队的得分情况来看,其中第5题是中国队失分最严重的一 ...
大模型面试最新高频问题整理(三)
文摘
2024-07-22 20:40
上海
KV Cache的基本原理?最本质的原理是避免重复计算,将需要重复计算的结果进行缓存,需要缓存的值为历史token对应的KV值,所以叫KV Cache。预测新的token只 ...
微软、Meta继续加码AI,云支出创历史新高 | AI脱水
文摘
2024-07-22 20:40
上海
点击上方 硬AI 关注我们根据市场共识预期,2024年全球云厂商资本支出预计将达到2,270亿美元,同比增长39%,创历史新高。AI芯片、AI网络、HBM内存和服务器CPU ...
ICML2024会议召开,Google Research相关活动
文摘
2024-07-22 16:27
上海
Google Research 是第 41 届国际机器学习大会(ICML 2024) 的钻石赞助商,该大会是顶级年度会议,本周在奥地利维也纳举行。作为机器学习研究领域的领导 ...
Google大语言模型Gemma 2介绍及其微调(上篇)
文摘
2024-07-22 16:27
上海
引言简介Gemma 2模型介绍架构设计训练方法后训练优化关键发现:知识蒸馏的影响性能评估使用体验:Hugging Chat如何提示 Gemma 2基于Hugging Fac ...
完全激活稀疏大模型,Q-Sparse突破LLM推理效能
文摘
2024-07-22 16:27
上海
来源:量子位只需激活60%的参数,就能实现与全激活稠密模型相当的性能。微软亚洲研究院的一项新研究,实现了模型的完全稀疏激活,让推理成本大幅下降。而且适用范围广泛,无论是从头 ...
奥特曼深夜发动价格战,GPT-4o mini暴跌99%!清华同济校友立功,GPT-3.5退役
文摘
2024-07-19 10:28
上海
新智元报道 编辑:编辑部【新智元导读】GPT-4o mini深夜忽然上线,OpenAI终于开卷小模型!每百万输入token已达15美分的超低价,跟GPT-3相比,两年 ...
【每日Leetcode】贪心系列(二)
文摘
2024-07-19 10:28
上海
【134. 加油站】在一条环路上有 n 个加油站,其中第 i 个加油站有汽油 gas[i] 升。你有一辆油箱容量无限的的汽车,从第 i 个加油站开往第 i+1 个加油站需要 ...
阿里千问团队AutoIF,让LLMs学会自我指导,简单有效,性能显著
文摘
2024-07-19 10:28
上海
论文:Self-play with Execution Feedback: Improving Instruction-following Capabilities of ...
千问2技术报告解读
文摘
2024-07-18 13:47
上海
Qwen2 系列发布了一整套基础和指令调整的语言模型,参数范围从 0.5 到 720 亿,包括四个密集模型,参数数量分别为 5 亿、15 亿、70 亿和 720 亿,加上一 ...
LLM在论文评审中被滥用?ICML2024论文研究结果
文摘
2024-07-18 13:47
上海
作者提出了一种估计大型语料中文本被大型语言模型大幅修改或产生的比例的方法。文中的最大似然模型利用专家编写和人工智能生成的参考文本,在语料库级别准确有效地检查现实世界的 LL ...
【每日Leetcode】BFS系列(一)
文摘
2024-07-18 13:47
上海
【二叉树的层序遍历】/** * Definition for a binary tree node. * struct TreeNode { * int val; ...
AI独角兽开始卖身大厂
文摘
2024-07-17 00:00
上海
点击上方 硬AI 关注我们一些AI独角兽陷入“生存困境”的同时,大厂开启"另类收购"。 硬·AI 作者 | 申思琦 编辑 | 硬 AI在2024年夏天,人 ...
如何提升大模型RAG系统的效果?RAG推理增强(二)
文摘
2024-07-17 00:00
上海
“如何提升大模型RAG系统的推理能力,尤其是RAG中的Generation部分,即假定我们已经检索到了Top K的相关文档出来之后,如何排除不相干的信息?如何根据已有信息进 ...
«
1
2
3
»
互联网持续学习圈
清华大学计算机系校友、前微软、阿里高级算法工程师创办。汇聚互联网精英、985高校及海外硕博、自主创业者,持续学习者的专属圈。专注互联网资讯、科研、求职等。器识其先,文艺其从,陪你进化二十年。
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉
热门文章
“请你记住:男人疯狂想念你时,会有的表现:3个字”
中国元首这一重磅演讲,传递哪些核心信息?
【双城传说Ⅱ】全新赛季抢先速览!「双城传说Ⅱ系列小小英雄」、「双城传说Ⅱ豪华宝典」即将上线!
只会摆拍的网红们,别毁了这件夹克
深二代:有车有房,一贫如洗
给孩子买摇粒绒的家长,都后悔了……
《小闯横莱坞》整顿演综,芒果为to C综艺“闯”出新路
2024.11.16 晚间三分钟
12月开始,家里没现金的注意,最好准备4-5万现金放家里,有2个原因
准新娘突然惨死家中,罪魁祸首竟是“冰箱”!厂商拒不认账,理由惹怒家属……
半周年主题服11月23日开启,年度剧本上线,《三国:谋定天下》年末大有看点
看了歼-35、苏-57,依旧有遗憾!展望2026年珠海航展,有哪些值得我们期待?
供货中芯国际,光刻胶大黑马,开始狂飙!
装不动了?其实早就没那么爱了吧…
92岁,还在跳舞与恋爱
新军官政策,打破年龄焦虑!
什么?怎么还有人不知道他俩是夫妻?!
她是内娱“现实版曲筱绡”,家世显赫情商超高,别再说她“恋爱脑”了!
三大消息:朝鲜发出最后通牒;绝不许大陆收台?普京警告毫不留情
身体出现这5个信号,说明你在有效减肥!
怎么防文班?湖人给出了答案
因为忠诚,所以封神
惊天6换2!0+0+0+0+0,太烂啦,别忍了!
5 种易致癌的做菜习惯,你家中了几个?
一周时讯 | 草间弥生联手喜茶打造最大南瓜雕塑展览;三顿半、ZARA、路易威登新店启幕
肩周炎疼痛怎么快速缓解?5种联合用药有特效
跑10公里,为何让这么多跑者上瘾?
这工资才叫做辅警改革!陕西咸阳迈出了第一步!辅警享受“公务员”待遇?这是怎么回事
“买10件退9件”的双十一背后,是已经变成试衣间的家
明天11月17号:农民永久退出土地!须具备3大条件? 每亩能补多少钱?一户一田:小田变大田!最新消息!
国补9折真香,小米夺双11销量王!
肿瘤消失:轻舟又过一重山 | MSI-H乳腺癌
明天11月17号:银行存款利率标准大改!存银行一万元,一年能领多少钱? 很多人不清楚!
特别容易出汗的人,是肾虚吗?
姑娘们别再羡慕这种身材了,烦恼特别多!(不是瘦)
发现一个奇怪的现象:天要帮你,先藏好自己,真正的高手都是充满智慧的,懂得何时该锋芒毕露,何时该低调内敛
明天11月17号:大雨、暴雨!寒潮大降温14℃!拉尼娜最新消息!大变天了!今年会是冷冬吗?
十二星男说不出口的爱,其实都藏在了他的行动中!
31位校友获评“中欧30周年杰出校友”
融创杀入了新赛道
金钱与肉体交易,她该相信谁?
对孩子不耐烦时,请不要忘了这句话
华为新机突然官宣:11月26日,新品正式发布!
肝最喜欢的一个睡觉姿势,帮你睡个好觉养足气血,所有人都适合!
有勇有谋,注定实力不凡的三个星座男
3年前,我卖掉广州300万的房子回老家盖100万的别墅打算享受生活,时间久了才发现住在乡下的弊端,又花200万买回原来广州的房子
人生所有相遇,一半助你,一半渡你【早课】第2143期
朗诵:烟火人间,彼此挂牵,深深懂得,淡淡喜欢
广州地铁四期稳了!南沙有望迎来3条新线,具体走向曝光!!
双11落幕,这个电商平台成了黑马
“一个男人不想失去你,才会有这种表现:4个字”
姬小满重做暴打所有T0!王者全新皮肤品质!竟比无双还珍贵?
张云龙出轨古力娜扎?李行亮喜欢留一手老婆?马伊琍资源下滑严重?矮个导演喜欢恋脚男?五阿哥比女人爱医美?
[11月15日]指数估值数据(慢牛一个月能涨多少;新书《股市长线法宝》连载中;抽奖福利)
“吃定一个男人,不是高频联系,也不是满足对方,而是:4个字”
我是孕母,但丁克。
男人对你有好感的1—5级程度对照表
全世界大吃一惊,美国突然变脸说不降息,这要干什么?
估价超200万的石头,是张大千旧藏,即将被拍!已有3次拍卖纪录,上次166.75万!
身上这4种肉疙瘩,可能和HPV感染有关
下班后,补充能量的6大方式
中年人最大的远见,是把家庭养成福地
开始抓人了!
中金公司成功举办2024年度投资策略会
刚刚,证监会突然发声!
建议所有大DAU游戏都来《和平精英》“抄抄安全答案”
过气网红,夜店再就业
突发跳水,跌近4%!发生了什么?机构:A股还能涨多高关键看这个信号!
明天、11月17号:大雨、暴雨突袭,寒潮大降温16℃?拉尼娜再爆冷!今年会是冷冬吗?农民注意4件事!
海绵玩2K丨OL1,SSR-吉尔伯特.阿里纳斯(经典版):拥有三分特工的零号特工!