WXRedian | 深度学习自然语言处理

公众号深度学习自然语言处理

周期

共找到 16 条记录

聊聊PRM（过程奖励模型）

教育 2025-01-10 19:12 江苏

知乎：姜富春地址：https://zhuanlan.zhihu.com/p/15540962086编辑：「深度学习自然语言处理公众号」，已授权1.什么是PRM？随着Ope ...

2024 年度总结 LLM System Research：过去半年的科研心路历程

教育 2025-01-09 22:05 江苏

飞往SFO的沿途风景，Shot on IPhone恰逢年末年度总结盛行，回国无心科研，我便强迫自己分享一下自己的过去半年的科研心路历程。目的有二：1. 继往开来，学有所思。 ...

强大推理背后的危机：PRMBench 揭示过程级奖励模型的潜在缺陷！

教育 2025-01-08 21:13 江苏

导语：最近，模型在长序列下的推理能力得到了大幅加强，出现了诸如o1，Gemini-thinking等强力多步推理模型。在这个过程中，过程级奖励模型（PRMs）是驱动大语言模 ...

Virgo：类o1多模态大模型的初步探索

教育 2025-01-08 21:13 江苏

24届毕业生聊PhD就业，国内or国外、学术界or工业界or创业

教育 2025-01-07 20:05 江苏

主题PhD如何择业之国内or国外、学术界or工业界or创业时间北京时间 2025.1.11 10:30-12:00内容PhD怎么找工作每种工作的好处和坏处工业界和学术界的 ...

清华团队靠强化学习让 7B 模型打败GPT-4o数学推理

教育 2025-01-07 20:05 江苏

来自：OpenBMB开源社区LLM所有细分方向群+ACL25/ICML25/NAACL25投稿群->LLM所有细分领域群、投稿群从这里进入！OpenAI o1 和 o ...

博士生罢工、工资上涨、学术头秃：PI生存指南

教育 2025-01-04 21:36 江苏

好久不写知乎了，新年除个草。其实这个碎碎念上个月就写好了，没发。现在想想反正写都写了，就图一乐呗，大家随便看看。知乎：周博磊链接：https://zhuanlan.zhih ...

[vLLM vs TensorRT-LLM]：动态序列长度场景对比

教育 2025-01-04 21:36 江苏

来源：oldpan原文：https://medium.com/squeezebits-team-blog/vllm-vs-tensorrt-llm-5-dynamic-se ...

图解Megatron TP中的计算通信overlap

教育 2025-01-04 21:36 江苏

来自：大猿搬砖简记这篇文章想来探索Megatron中实现计算通信overlap的方法。具体来说，Megatron的dp、tp和pp部分，都有可以做overlap的地方，本文 ...

从infra的视角聊聊DeepSeek-V3

教育 2025-01-03 19:41 江苏

看完技术报告，从infra的视角分享一些个人看法，供大家讨论。首先，训练超大号的MoE模型，仅使用两千张H800加两个月的时间，就能达到如此好的效果，这点实在是太强了。只能 ...

手写self-attention的四重境界 self-attention

教育 2025-01-03 19:41 江苏

背景在 AI 相关的面试中，经常会有面试官让写 self-attention，但是因为 transformer 这篇文章其实包含很多的细节，因此可能面试官对于 self-a ...

o1类大模型的过度思考: 2+3=？

教育 2025-01-02 15:57 江苏

腾讯AI Lab和上交发现在面对一个基本的算术问题“2+3=？”时，o1类LLMs为何会表现出过度思考的现象。这个问题虽然简单，但它揭示了当在处理复杂任务时，这些模型是否真 ...

2024年RAG：回顾与展望

教育 2025-01-02 15:57 江苏

来自：ChallengeHubLLM所有细分方向群+ACL25/ICML25/NAACL25投稿群->LLM所有细分领域群、投稿群从这里进入！2024年，RAG（Re ...

Building effective agents笔记

教育 2025-01-02 15:57 江苏

来自：SimpleAI and ...最近阅读了 Anthropic 发表于12月20号的一篇文章《Building effective agents》（https://w ...

微软公布OpenAI闭源模型参数！4o-mini 8B！

教育 2025-01-01 19:39 江苏

大家新年好！祝大家新的一年薪资歘欻的涨，论文嗖嗖的发！没错，就在前几天，Microsoft发布的arxiv里竟然写了OpenAI闭源的大模型的具体参数！（消息来自：xhs博 ...

NICE42期 | 语言模型不听话怎么办？关于格式忠实性的探索

教育 2025-01-01 19:39 江苏

1. 主题语言模型不听话怎么办？关于格式忠实性的探索2. 时间2025.1.3 20:00-21:003. 引言遵循给定的格式要求生成结构良好的文本是大语言模型的一项基本功 ...

深度学习自然语言处理

一个热衷于深度学习与NLP前沿技术的平台，期待在知识的殿堂与你相遇~

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉