首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
公众号
GiantPandaCV
周期
2024年11月
2024年10月
2024年09月
2024年08月
2024年07月
2024年06月
2024年05月
2024年04月
2024年03月
2024年02月
2024年01月
2023年12月
2023年11月
2023年10月
2023年09月
2023年08月
2023年07月
2023年06月
2023年05月
2023年04月
2023年03月
2023年02月
2023年01月
2022年12月
2022年11月
2022年10月
2022年09月
2022年08月
2022年07月
2022年06月
2022年05月
2022年04月
2022年03月
2022年02月
2022年01月
2021年12月
2021年11月
2021年10月
2021年09月
2021年08月
2021年07月
2021年06月
2021年05月
2021年04月
2021年03月
2021年02月
2021年01月
2020年12月
2020年11月
2020年10月
2020年09月
2020年08月
2020年07月
2020年06月
2020年05月
2020年04月
2020年03月
2020年02月
2020年01月
共找到
17
条记录
OpenAI o1 技术初探2:使用MCTS增强推理能力(基于代码实践的解读)
科技
2024-10-27 22:40
四川
在o1的整体框架篇中(https://zhuanlan.zhihu.com/p/773907223),我们从现有开源的论文和代码中(https://github.com/h ...
【ml-engineering 翻译系列】AI系统中的网络概述
科技
2024-10-25 21:50
日本
我的课程笔记,欢迎关注:https://github.com/BBuf/how-to-optim-algorithm-in-cuda/tree/master/cuda-mo ...
【ml-engineering 翻译系列】大模型推理
科技
2024-10-24 23:55
日本
我的课程笔记,欢迎关注:https://github.com/BBuf/how-to-optim-algorithm-in-cuda/tree/master/cuda-mo ...
【翻译】使用PyTorch FSDP和Torch.compile最大化训练吞吐量
科技
2024-10-23 11:43
日本
博客链接:https://pytorch.org/blog/maximizing-training-throughput/。博客由 IBM 的 PyTorch 团队和 Me ...
课程升级、资源加码!万人共学的书生大模型实战营第4期正式起航!
科技
2024-10-22 16:25
日本
不知不觉间,书生大模型实战营已迎来第四期!回顾前三期,累计超过 15W 人次踊跃参与,涌现出像「InternDog」和「销冠——卖货主播大模型」这样的明星项目,感谢社区小伙 ...
OpenAI o1 技术初探1:整体框架,利用Test-Time Scaling Law提升逻辑推理能力
科技
2024-10-21 14:26
日本
前段日子OpenAI推出的o1模型,以其提升显著的逻辑推理能力,引发了人们对它背后训练方法的热烈讨论。关于o1的介绍和输出结果demo,这里就不再赘述,大家可以去opena ...
【翻译】使用PyTorch FSDP最大化训练吞吐量
科技
2024-10-20 19:58
四川
博客链接:https://pytorch.org/blog/maximizing-training/ 。博客由 IBM 的 PyTorch 团队和 Meta 的 PyTor ...
图文详解 Continuous Batch:不写 CUDA Kernel 也能成倍优化推理效率
科技
2024-10-18 18:02
日本
在“开席”之前,咱们先来热热身!看看下面大模型推理调度的“高频面试题”,你能答上来几道?1.调度策略有哪些?各有什么优缺点2.什么时候会触发调度?3.Continuous ...
CUDA-MODE 课程笔记 第14课,Triton 实践指南
科技
2024-10-17 18:30
日本
我的课程笔记,欢迎关注:https://github.com/BBuf/how-to-optim-algorithm-in-cuda/tree/master/cuda-mo ...
【翻译】CUDA-Free Inference for LLMs
科技
2024-10-16 09:20
四川
blog链接:https://pytorch.org/blog/cuda-free-inference-for-llms/无CUDA的LLM推理作者:Adnan Hoque ...
揭秘 PagedAttention(上):如何管理 Paged KV Cache
科技
2024-10-15 12:18
日本
在开始之前,给大家出几个“高频面试题”,可以先思考下:1. 朴素实现的 KV Cache 为什么会带来显存浪费,用什么方法来解决?2. 每个请求长度都不一样,如何让它的 K ...
图解KV Cache:加速大模型推理的幕后功臣
科技
2024-10-14 15:34
日本
在开始之前,给大家出几个“高频面试题”,看看你能答上来吗?1. 举例说明 KV Cache 的计算过程2.为什么要用 KV Cache?它能解决什么问题,代价又是什么?3. ...
Flex Attention API 应用 Notebook 代码速览
科技
2024-10-13 18:24
日本
对FlexAttention的常见API的使用方法做一个解读,博客来源:https://github.com/pytorch-labs/attention-gym/blob ...
将GLM-4-Plus大模型应用到Cursor中
科技
2024-10-12 00:00
日本
0x0. 前言笔者关注智谱很久了,对智谱的模型也很心动,一方面动力不足,另一方面限于token等问题一直没来得及体验,没想到国庆月的到来,智谱直接发出了“绝杀技能”。智谱开 ...
大语言模型推理,用动画一看就懂!
科技
2024-10-09 22:35
日本
这是《vLLM 深入浅出》系列的第一篇,用动画带你直观了解大语言模型推理的秘密,并解锁其中的三个核心挑战。大语言模型的推理过程假设输入的 prompt 是 "The fut ...
【翻译】【PyTorch 奇技淫巧】FlexAttetion 基于Triton打造灵活度拉满的Attention
科技
2024-10-08 21:14
日本
blog链接:https://pytorch.org/blog/flexattention/ 代码示例:https://github.com/pytorch-labs/at ...
【翻译】torch.compile 的详细示例解析教程
科技
2024-10-07 22:34
日本
教程链接:https://depyf.readthedocs.io/en/latest/walk_through.htmltorch.compile 的详细示例解析本教程旨 ...
GiantPandaCV
专注于大语言模型,CUDA,编译器,工程部署和优化等多个方向技术分享。我们不仅坚持原创,也规范转载知乎大佬们的高质量博文。希望在传播知识、分享知识的同时能够启发你,在人类通往AGI的道路上互相帮助(・ω\x26lt;)☆
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉
热门文章
急诊转入 1 名全身溃烂患者,医生感叹:这病比教科书还全
2024.11.03 晚间三分钟
生姜买多了怎么保存?卖姜老板教我一招,不干不烂,放一年都新鲜
真正厉害的女生都非常安静。
A股牛市已结束,还是倒车接人?
一种会让牙齿掉光的病,很多人年轻时不重视
002058,低空经济正宗龙头,市占率全球前三,极具确定性!
美国10月非农增1.2万大幅低于预期,将降息?终于有人把美联储的把戏说透了
每天5点半起床,12点入睡,在职宝妈一年过CPA 六科!
无货可卖!客商紧急冷库调货
这一味阳性食材,直接把阳气补到身体里!肚子也小了一圈,阳虚湿重的人一定要试试
十二生肖11月4日运程
跌了,跌了,猪价下跌“拦不住”!附:11月4日猪价
金牌 金牌 金牌……宁波各地各校本周热点来了!
苹果春季四款新品曝光,都是适合普通用户的实用产品
姜萍事件阿里达摩院的通报就是在推卸责任
生殖功能较强的男性,通常有以下几个共性,若你全占,值得恭喜!
已升级为三甲医院!除了雪饼和碎冰冰,旺旺医院里还有什么?
左手骨折!右肩撕裂!胖虎,一定要顶住!!
《封神2》定档大年初一,辛芷蕾张颂文新片官宣
国央企上班,内耗自己不如外耗他人
聊一款"兼具两项稀有配置"的全画幅微单
大多数家庭都超标!怎么做饭才能控好用盐用油量?|健康之路
李小璐贾乃亮高调宣布!合体反击太漂亮了
明天11月4号: 一村一辅警、一户一宅最新消息!土地承包延包整省试点!你家签合同了吗?
因为犹豫不决而错过真爱的星座
兖州: 最强队伍, 姜维开荒7天100万战功,版本之子
新行情何时开启 下周三大事件
朗诵:幸福与平安相连,美好与健康相映
没天理了!青海,邻居大爷未经允许骑走男子的自行车,因刹车失效致9级伤残,向男子索赔13万,邻居:你没拒绝,就是同意借车!法院判了
明天11月4号:中到大雨!暴雨!寒潮大降温12℃!拉尼娜最新消息!今年会是冷冬吗?农民需注意2件事!
明天11月4号:大雨、暴雨!大暴雨!新一轮寒潮大降温12℃!拉尼娜最新消息!今年会是冷冬吗? 农民注意3件事!
明天11月4号:中到大雨!大雪、暴雪!寒潮大降温12℃!拉尼娜最新消息!今年会是冷冬吗?农民注意风险!
大事发生,赶快储备现金!
加布兽来了!低分高能预警!实况足球国服每周精选简析!
高考成绩500分左右,想到大型国企工作,可以重点看这5所冷门院校
玉米“一夜大涨”,每吨上涨20、40、60元!11月3日起:锣鼓喧天、鞭炮齐鸣!玉米开始加速上涨!
【2024.11.2】艺人怎么找到自己适合的风格?大梦归离播出效果?白鹿、赵露思、虞书欣占据市场?刘心悠默认退圈了?
【2024.11.2】普颜值的明星容貌焦虑?小巷人家播出热度?随便聊聊张晚意?王俊凯新专辑?酱园弄定档?季肖冰和他老婆?
出航啃炖猪肘,返航喝酸菜汤,二战德军“海狼”三餐都吃啥?
“说好的”Switch2消息,怎么没了?
恋爱开关|暧昧期最无语の四大星座
长腿格格买婚房了
所有人都在等大时刻揭晓,经济巨变未来几天惊心动魄
“请你记住:无论是夫妻还是情侣,多了这样东西,就是缘尽了”
11月运程来了 ‖ 土星恢复顺行,12星座的亊业、感情、金銭有哪些机遇?【直播文字版】
准备好,你的棉袄 !
一个男人不想失去你,会常说三句话,别不懂
当一个男人渐渐不爱你时,会有五个生理表现,再难过也要及时止损
这个每天为你吃苦的器官,就是这样被你害死的
与有“蓉”焉,与爱同行!成都蓉城1-2上海申花
继冲锋衣和鞋后,户外品牌开始「卷」针织品了
真厉害的人,真不着急(好好反思)
嗡嗡嗡嗡嗡嗡嗡嗡嗡嗡嗡嗡嗡嗡嗡嗡
双十一今年降价最狠的相机是什么?
非农爆冷,美国金融流动性告急
特朗普立大功,抓到了干涉美国大选的国家!全世界都没想到,居然是它
湖南常德跑出超级隐形冠军:年入8亿,市占率7.9%
女生千万别找这种搭子。
中国海军放弃歼-20上舰的真实原因?2040年歼-35装备800架重塑舰载机体系?
A股第二个茅台,可以永续成长20年的公司,明显低估了!
中了瞒天过海之计!3600俄军全军覆没,统帅被枭首示众,俄国惨遭希瓦教训
西藏人最爱吃这种油,他们很瘦,糖尿病患病率中国最低,太神奇了.....
低空经济第一黑马,全球储能稀缺龙头,第二个宁德时代!
2024前三季度结婚登记大降94万创历史新低?终于有人说出了中国婚姻真相
突发!重磅数据崩了!
冷库抢先开库,交易价格流出
糖尿病患者用这5个方法保护好胰岛功能,可以大大延缓糖尿病病情的进展,早用早受益
某rapper连隐私都被曝光了,以后还有的混吗?
豪宅销冠!第一视角!归家动线全景兑现!