周期
共找到 14 条记录
文摘   2024-11-19 08:37   北京  
作者:ybq原文:https://zhuanlan.zhihu.com/p/6290579087从这篇文章开始,我会不定期分享利用 OpenRLHF 学习 RLHF 的一些 ...
文摘   2024-11-18 20:46   中国香港  
作者:lym原文:https://zhuanlan.zhihu.com/p/890327005如果可以用prompt解决,尽量用prompt解决,因为训练(精调)的模型往往 ...
文摘   2024-11-18 20:46   中国香港  
在去年的这个时候,我以deepspeed-chat的代码为例,解读了rlhf运作的流程。当时写这篇文章的目的,主要是想让读者在没有强化学习知识的情况下,能从直觉上快速理解这 ...
文摘   2024-11-15 09:00   北京  
本文是2023年中文章大模型来自面试的一些体会和分享,2024年中文章大模型来自面试的体会和分享 2024版的续续集。大模型校招的薪资在2024年秋季年首次亮相,相比去年2 ...
文摘   2024-11-14 10:00   中国香港  
前言项目开始于2024年3月初,当时朋友搞到了一台不知道能用多久的A100。这么棒的机器放着也是浪费,就琢磨着尝试从零训练一个小型号的LLM。其实在当时就有不少些这种“从零 ...
文摘   2024-11-14 10:00   中国香港  
最近由M-A-P、无限光年、墨尔本大学、复旦大学等机构共同开发的OpenCoder开源了模型和部分数据,并且后续还会有更多资料放出。先来学习下技术报告的内容。目前各个规模和 ...
文摘   2024-11-13 08:41   北京  
 作者:ybq链接:https://zhuanlan.zhihu.com/p/6497090767最近在清洗 sft 的数据,不得不说这工作是真磨人啊,细节多到让人抓狂。可 ...
文摘   2024-11-12 10:02   北京  
时隔27年,原作者携xLSTM回归,通过引入指数门控和修改记忆结构来增强传统LSTM的能力,不仅打破了LSTM在处理长序列和复杂依赖关系方面的局限性,并在广泛的任务和基准测 ...
文摘   2024-11-11 12:00   中国香港  
作者:黄哲威 hzwer链接:https://www.zhihu.com/question/347847220/answer/26536819499前大模型时代写过一些深度 ...
文摘   2024-11-08 16:31   中国香港  
智谱的哥们说,他们的视频生成产品又又又升级了。“这次绝对震撼,不仅仅图生视频的效果更好了,更牛的是让视频有声音了。”以前不管sora还是啥,大家搞的都是“默片”,真到用的时 ...
文摘   2024-11-07 18:30   中国香港  
知乎:方佳瑞(已授权)地址:https://zhuanlan.zhihu.com/p/4264163756FlashAttention(FA)是大模型训练和推理性能优化最重 ...
文摘   2024-11-06 18:30   中国香港  
随着ACL 2024大会的圆满落幕,本文将重点介绍会议中涉及的与Retrieval-Augmented Generation(RAG)相关的论文,探索这一领域最新的研究成果 ...
文摘   2024-11-04 09:13   美国  
基于LLM的生成式搜索引擎(Generative Search Engines)正在取代传统搜索引擎。答案引擎不仅检索与用户查询相关的来源,还综合引用这些来源的答案摘要。与 ...
文摘   2024-11-04 09:13   美国  
大家好,在序列并行系列中,我们已经介绍过了Megatron SP,今天这篇文章我们来看DeepSpeed Ulysses。在正文开始前,请允许我吐槽一下,DeepSpeed ...
包包算法笔记
大模型技术和行业认知
 热门文章