首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

AI界的拼多多又来整活！deepseek全新上线R1-Lite预览版！

科技 2024-11-21 08:33 北京

AI界的拼多多又来整活啦！

作者丨不寒

编辑丨刘欢

幻方量化旗下AI初创公司DeepSeek宣布其推理模型R1-Lite预览版正式上线！AI领域再次掀起了波澜！

DeepSeek的产品线以开源为主，包括多个百亿级参数的模型，如DeepSeek-LLM、DeepSeek-Coder，以及混合专家模型（MoE）DeepSeek-V2和V2.5。

DeepSeek-R1-Lite模型的推出，标志着公司在推理模型领域的重要进展。

DeepSeek R1系列模型采用先进的强化学习技术进行训练，其推理过程深入细致，并包含大量的反思与验证环节。

模型在思维链的长度上能够达到数万字的级别，并在数学、代码以及各类复杂逻辑推理任务上展现出卓越的性能。

正式版的DeepSeek-R1模型将完全开源

DeepSeek-R1-Lite预览版的推出，也标志着中国国产大模型在推理模型在实际应用中迈出了重要一步。

在具体的性能测试中，DeepSeek-R1-Lite在美国数学竞赛（AMC）中难度最高的AIME赛事以及全球顶级编程竞赛Codeforces等评测中，均取得了优异的成绩，甚至超越了GPT-4o等知名模型。

deepseek也在X上发布了DeepSeek-R1-Lite-Preview 在各项基准测试中的成果（如图）。

进一步验证了DeepSeek-R1-Lite在复杂逻辑推理任务上的强大实力。

DeepSeek-R1-Lite的推理过程不仅长度可观，而且其包含的反思与验证环节也大大增强了其推理的准确性。官方提供的数据显示，模型在数学竞赛上的得分与其所允许的思考长度紧密相关。

图：DeepSeek-R1-Lite预览版的推理扩展法则，推理越深入，性能越好。

换句话说，给予模型更多的思考时间，其推理的准确率也会相应提升。

尽管DeepSeek-R1-Lite已经展现出了强大的推理能力，但官方表示该模型目前仍处于迭代开发阶段。

目前，DeepSeek-R1-Lite仅支持在网页上使用，尚未开放API调用功能。

不过，DeepSeek公司也透露，正式版的DeepSeek-R1模型将完全开源，并公开技术报告以及部署API服务。

AI界拼多多-DeepSeek是谁？

DeepSeek（深度求索）是由幻方量化创始人梁文锋创立的AI初创公司，专注于开发通用人工智能（AGI）底层模型和技术。

公司成立于2023年，源于梁文锋在量化投资领域的成功和对AI的热衷，幻方量化是国内量化私募领域的巨头之一，管理规模曾一度飙升至千亿，为DeepSeek提供了强大的资金和硬件支持。

DeepSeek的核心技术包括其创新的MLA（多头潜在注意力机制）架构和DeepSeekMoESparse结构。这些技术使得推理成本大幅降低。

例如，DeepSeek V2模型的推理成本仅为每百万token 1块钱，远低于市场上的其他同类产品。这种架构创新不仅降低了显存占用，还减少了计算量，从而实现了成本的大幅下降。

DeepSeek的主要产品包括多个百亿级参数的模型，如DeepSeek-LLM、DeepSeek-Coder、DeepSeek-V2和V2.5等。这些模型在数学、代码和复杂逻辑推理任务上表现出色。

DeepSeek还提供了API服务，支持128K上下文长度，并且与OpenAI API兼容容。DeepSeek的API定价为每百万输入token 0.14美元，每百万输出token 0.28美元。

这一价格显著低于当前市场上的其他同类产品，仅为GPT-4-Turbo价格的近百分之一。

由此，引发了中国大模型价格战，迫使包括字节、腾讯、百度、阿里等大厂纷纷降价。

deepseek也一举成名。

也是为什么DeepSeek被称为AI界的拼多多。

推荐阅读

END

http://mp.weixin.qq.com/s?__biz=MzA5NTI1MDEyNA==&mid=2652718945&idx=1&sn=76fd70c87664a92c7784bdb5af69962d

科技与产业创新服务平台

最新文章

日进180亿元，“三桶油”线下抢桩

净利率暴跌，金融IT海外求生？神州信息VS长亮科技财报解析

杨歌Gary：特朗普胜选后的格局剧变

智能戒指Oura获投7500万美金，扎克伯格也是用户

亲民且开源！阿里推理模型Marco-o1震撼发布！

重磅！单做AI搜索不够，OpenAI要开发浏览器！！趁机火拼谷歌！

拼多多发布Q3财报：营收994亿元，同比增44%；净利润250亿元，同比增长61%

AI搜索：技术与商业的“双面棋局”，要革小红书的命？

百度Q3财报：净利润增17%超预期，文心大模型日调用量增30倍达15亿

WIM2024创新者年会榜单征集评选开始了！

钟睒睒把自己“逼”到了企业家直播的对立面

AI界的拼多多又来整活！deepseek全新上线R1-Lite预览版！

英伟达发布最新Q3财报，净利润同比增长109%！但股价却跌了？

快手发布2024年Q3炸裂成绩单：利润31.19亿元，同比大增41.1%，电商GMV达3342亿元

钟首富，初遇滑铁卢

60岁掌门人重返一线，过气奶茶香飘飘陷入迷途

女首富宗馥莉，搞不定“无糖”，如何续写自己的新故事？

“减肥神药”暴利生意经：马斯克“代言”，两巨头今年已赚1196亿元

中国年轻人不爱保时捷了

过气网红，夜店再就业

苹果减产、华为“难产”，平替者强势入局，头显真凉了？

拥挤的智能AR眼镜赛道，行业老炮Rokid再战产业新兵

“AIGC第一股”跌成“最惨AI股”，出门问问投资者巨亏数千万

银河通用获5亿元战略轮融资，探索多场景商业化落地

真的假的？马斯克大模型搞定黎曼猜想？

阿里巴巴2025财年Q2财报出炉：营收2365亿元，净利润增长63%，淘天集团营收989.9亿元

联想业绩暴增背后，ISG业务仍拖后腿，亏损超5亿元

京东发布2024年Q3财报：营收2604亿元，经营利润120亿元，启动50亿美元新回购计划

80后Keras之父从谷歌正式离职！谷歌两位重量级VP联名感谢！

大佬喊话，AI寒冬已来？

灵宝CASBOT首款人形机器人产品—CASBOT 01发布，通用类脑智能机器人瞄准多场景落地

双十一，那个消费狂欢时代结束了

具身智能“投资热”仍在持续，高瓴创投、蓝驰创投领投具身智能创企

百度世界大会，李彦宏甩不出“王炸”！

赛程近尾声，谈谈第16个“双十一”的三大看点

“过气CEO”沉迷直播间，谁来救救美特斯邦威

李善友：张一鸣做对了什么？

成立九个月，完成三轮融资，千寻智能发力人形机器人研发

全球城配自动驾驶领军企业「九识智能」完成1亿美元B1轮融资，光源资本担任独家财务顾问

跌落神坛：聚美优品，快没了

拼多多百亿补贴启动第三轮“超级加倍补”，第二轮订单量突破4500万单

雷军与小米的高端之路

一汽大众投资百亿，还是玩不转ID

“AI For X · 未来产业范式跃迁”暨WIM2024创新者年会即将开幕！

小鹏 AI 机器人Iron 发布，何小鹏说没有500亿造不好AI机器人

大模型在ToB市场的潜力：解决方案超越技术的价值

定了！特朗普重新夺回白宫！国内科技的达摩克利斯之剑要落？

王传福、安聪慧必有一战

美的绿色工业实践：九大行业案例深度解析

美国大选揭晓在即！哈里斯、特朗普激烈对抗，却在医疗这一点达成共识

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉