周期
共找到 5 条记录
文摘   2024-11-17 12:12   日本  
项目开始于2024年3月初,当时朋友搞到了一台不知道能用多久的A100。这么棒的机器放着也是浪费,就琢磨着尝试从零训练一个小型号的LLM。其实在当时就有不少些这种“从零预训 ...
文摘   2024-11-17 12:12   日本  
会议简介中国中文信息学会(CIPS)是中国中文信息处理及其相关领域的学术团体,大模型与生成专业委员会(LMG)是中国中文信息学会旗下的专业委员会,全国大模型智能生成大会(L ...
文摘   2024-11-08 08:50   江苏  
今天给大家带来知乎@真中合欢的大模型实践系列文章-LLM的拒绝采样。作者:真中合欢 知乎:https://zhuanlan.zhihu.com/p/4547529049拒绝 ...
文摘   2024-11-05 17:47   美国  
下面实测内容没有任何个人观点,仅为测试结果。另外,测试用例可能不多,但都是之前常测得一些问题,今天突然发现腾讯开源混元大模型,十分震惊,腾讯也来挤开源赛道了,只能说大模型开 ...
文摘   2024-11-01 09:00   江苏  
现在做toB项目,被问的最多的就是支不支持国产化。现在一般用的最多的也是华为昇腾系列显卡。今天给大家带来一篇利用GPUStack框架在昇腾910B上进行Qwen2.5推理部 ...
NLP工作站
日常分享AIGC前沿知识&落地经验总结,也欢迎关注《ChatGPT原理与实战》、《大型语言模型实战指南》两本大模型相关书籍
 热门文章