周期
共找到 17 条记录
科技   2024-10-27 22:40   四川  
在o1的整体框架篇中(https://zhuanlan.zhihu.com/p/773907223),我们从现有开源的论文和代码中(https://github.com/h ...
科技   2024-10-25 21:50   日本  
我的课程笔记,欢迎关注:https://github.com/BBuf/how-to-optim-algorithm-in-cuda/tree/master/cuda-mo ...
科技   2024-10-24 23:55   日本  
我的课程笔记,欢迎关注:https://github.com/BBuf/how-to-optim-algorithm-in-cuda/tree/master/cuda-mo ...
科技   2024-10-23 11:43   日本  
博客链接:https://pytorch.org/blog/maximizing-training-throughput/。博客由 IBM 的 PyTorch 团队和 Me ...
科技   2024-10-22 16:25   日本  
不知不觉间,书生大模型实战营已迎来第四期!回顾前三期,累计超过 15W 人次踊跃参与,涌现出像「InternDog」和「销冠——卖货主播大模型」这样的明星项目,感谢社区小伙 ...
科技   2024-10-21 14:26   日本  
前段日子OpenAI推出的o1模型,以其提升显著的逻辑推理能力,引发了人们对它背后训练方法的热烈讨论。关于o1的介绍和输出结果demo,这里就不再赘述,大家可以去opena ...
科技   2024-10-20 19:58   四川  
博客链接:https://pytorch.org/blog/maximizing-training/ 。博客由 IBM 的 PyTorch 团队和 Meta 的 PyTor ...
科技   2024-10-18 18:02   日本  
在“开席”之前,咱们先来热热身!看看下面大模型推理调度的“高频面试题”,你能答上来几道?1.调度策略有哪些?各有什么优缺点2.什么时候会触发调度?3.Continuous ...
科技   2024-10-17 18:30   日本  
我的课程笔记,欢迎关注:https://github.com/BBuf/how-to-optim-algorithm-in-cuda/tree/master/cuda-mo ...
科技   2024-10-16 09:20   四川  
blog链接:https://pytorch.org/blog/cuda-free-inference-for-llms/无CUDA的LLM推理作者:Adnan Hoque ...
科技   2024-10-15 12:18   日本  
在开始之前,给大家出几个“高频面试题”,可以先思考下:1. 朴素实现的 KV Cache 为什么会带来显存浪费,用什么方法来解决?2. 每个请求长度都不一样,如何让它的 K ...
科技   2024-10-14 15:34   日本  
在开始之前,给大家出几个“高频面试题”,看看你能答上来吗?1. 举例说明 KV Cache 的计算过程2.为什么要用 KV Cache?它能解决什么问题,代价又是什么?3. ...
科技   2024-10-13 18:24   日本  
对FlexAttention的常见API的使用方法做一个解读,博客来源:https://github.com/pytorch-labs/attention-gym/blob ...
科技   2024-10-12 00:00   日本  
0x0. 前言笔者关注智谱很久了,对智谱的模型也很心动,一方面动力不足,另一方面限于token等问题一直没来得及体验,没想到国庆月的到来,智谱直接发出了“绝杀技能”。智谱开 ...
科技   2024-10-09 22:35   日本  
这是《vLLM 深入浅出》系列的第一篇,用动画带你直观了解大语言模型推理的秘密,并解锁其中的三个核心挑战。大语言模型的推理过程假设输入的 prompt 是 "The fut ...
科技   2024-10-08 21:14   日本  
blog链接:https://pytorch.org/blog/flexattention/ 代码示例:https://github.com/pytorch-labs/at ...
科技   2024-10-07 22:34   日本  
教程链接:https://depyf.readthedocs.io/en/latest/walk_through.htmltorch.compile 的详细示例解析本教程旨 ...
GiantPandaCV
专注于大语言模型,CUDA,编译器,工程部署和优化等多个方向技术分享。我们不仅坚持原创,也规范转载知乎大佬们的高质量博文。希望在传播知识、分享知识的同时能够启发你,在人类通往AGI的道路上互相帮助(・ω\x26lt;)☆
 热门文章