周期
共找到 50 条记录
文摘   2024-07-16 14:20   上海  
作者:swtheking来源:知乎Pretraining部分Data Collection整个pretrain阶段最重要的部分就是数据收集,尽管OpenAI已经给我们了一套 ...
文摘   2024-07-16 14:20   上海  
金磊 发自 凹非寺量子位 | 公众号 QbitAI大模型理解、推理Excel,现在变得更加精准了。这就是来自微软的一项最新研究——SPREADSHEETLLM,主打的就是让 ...
文摘   2024-07-16 14:20   上海  
“ 从去年GPT爆火之后,越来越多的工业界和学术界都关注Agent的应用。本文尝试捋一下两方面工作:1、对于较为复杂的任务,Agent推理规划能力一直被诟病,尤其是《Tra ...
文摘   2024-07-16 14:20   上海  
【210. 课程表 II】现在你总共有 numCourses 门课需要选,记为 0 到 numCourses - 1。给你一个数组 prerequisites ,其中 pr ...
文摘   2024-07-15 16:44   上海  
Attention的优化?大模型面试之注意力机制的优化总结解码方式有哪些?如何让大模型生成解码阶段的结果更好:从Beam Search到top_k、top_p等参数的实现原 ...
文摘   2024-07-15 16:44   上海  
点击上方 硬AI 关注我们奥特曼认为,Oklo公司“最有可能实现先进裂变能源解决方案的商业化”。杰夫·贝索斯、比尔·盖茨、彼得·蒂尔等科技和投资大佬也是该公司的金主。。  ...
文摘   2024-07-15 16:44   上海  
RAG在整个大模型技术栈里的重要性毋庸置疑,而在RAG中,除了大模型之外,另一个不可或缺的部分,就是搜索系统,大模型的正确、稳定、可控生成,离不开精准可靠的搜索系统,大量的 ...
文摘   2024-07-11 18:07   上海  
夕小瑶科技说 原创作者 | 21#前段时间,美国乔治城大学的数据分析平台ETO发布了一组关于《人工智能研究年鉴》统计数字,着实让小编震惊。先说结论:1、在 2017 年至 ...
文摘   2024-07-11 18:07   上海  
关于MOE模型的综述。可以看看基本发展以及建模方法,MoE作为一种有效的方法,可以在不显著增加计算开销的情况下扩展模型容量,MoE模型由多个专家网络和一个门控网络组成,门控 ...
文摘   2024-07-11 18:07   上海  
© 作者|侯新铭机构|中国人民大学研究方向|自然语言处理、大语言模型大语言模型在各种自然语言处理任务中表现出色,但在处理复杂现实任务时仍面临各种困难。在这项研究中,我们提出 ...
文摘   2024-07-11 18:07   上海  
【124. 二叉树中的最大路径和】两个水壶,容量分别为 x 和 y 升。水的供应是无限的。确定是否有可能使用这两个壶准确得到 target 升。来源:力扣(LeetCode ...
文摘   2024-07-10 16:59   上海  
高盛报告指出,AI在未来十年内对经济的实际影响会很有限,AI只会使美国生产力增加0.5%,GDP仅增加0.9%,这会导致投入的数百亿美元可能会被浪费,而美股“七姐妹”获得的 ...
文摘   2024-07-10 16:59   上海  
点击上方 硬AI 关注我们Bernstein认为,随着AI芯片加速迭代,英伟达相较于其他厂商的领先优势将进一步扩大,台积电的先进封装优势料将延续,ASIC芯片市场有望扩张。 ...
文摘   2024-07-10 16:59   上海  
© 作者|杨锦霞机构|中国人民大学研究方向|多模态学习论文题目:Unlocking the Power of Spatial and Temporal Informatio ...
文摘   2024-07-10 16:59   上海  
【1167. 连接木棍的最低费用】你有一些长度为正整数的木棍。这些长度以数组 sticks 的形式给出, sticks[i] 是第 i 个木棍的长度。你可以通过支付 x + ...
文摘   2024-07-09 10:12   上海  
作者:皓天来源:https://zhuanlan.zhihu.com/p/706106906近期,gsm8k、MATH被各种7B小模型刷的飞起,其中,step-level- ...
文摘   2024-07-09 10:12   上海  
作者 | 冯卡门迪 整理 | NewBeeNLPhttps://zhuanlan.zhihu.com/p/705497209这一两年推荐的论文工作离不开冷启和长尾问题,就像 ...
文摘   2024-07-09 10:12   上海  
【323. 无向图中连通分量的数目】之并查集解法你有一个包含 n 个节点的图。给定一个整数 n 和一个数组 edges ,其中 edges[i] = [ai, bi] 表示 ...
文摘   2024-07-07 18:08   上海  
随着大模型和AI技术的火爆,互联网大厂在AI人才的竞争也越来越激烈,除了从openAI,微软,Meta等大厂挖人,发掘新人也是一个很重要的方法。近期,国内互联网大厂都公布了 ...
文摘   2024-07-07 18:08   上海  
作者 | 番茄爱鸡蛋 整理 | NewBeeNLP https://zhuanlan.zhihu.com/p/688913185零、论文信息论文题目:Wukong: Tow ...
互联网持续学习圈
清华大学计算机系校友、前微软、阿里高级算法工程师创办。汇聚互联网精英、985高校及海外硕博、自主创业者,持续学习者的专属圈。专注互联网资讯、科研、求职等。器识其先,文艺其从,陪你进化二十年。
 热门文章