今日开源(2024-11-05):腾讯发布Hunyuan-Large,业界最大开源MoE模型,389B参数,支持256K上下文

文摘   2024-11-05 19:12   北京  


🏆基座模型

①项目:Hunyuan-Large

Hunyuan-Large是由腾讯开源的基于Mixture of Experts (MoE)的Transformer模型,拥有389B参数,其中52B为活跃参数。该模型在自然语言处理、计算机视觉等领域表现出色,旨在通过优化资源消耗来保持高性能。

☆一键收藏:

https://sota.jiqizhixin.com/project/Hunyuan-Large


②项目:SAM2Long

SAM2Long项目旨在提升SAM 2在长视频分割中的表现,通过引入无训练的记忆树结构,解决了在长视频场景中常见的错误累积问题。该项目在处理物体遮挡和重现时表现出色,显著提高了分割的准确性和鲁棒性。

☆一键收藏:

https://sota.jiqizhixin.com/project/sam2long


🛠️框架平台、必备工具

①项目:LLaMA-O1

LLaMA-O1是一个开源的大型推理模型框架,旨在通过蒙特卡罗树搜索(MCTS)、自我博弈强化学习(Self-Play Reinforcement Learning)、PPO、AlphaGo Zero的双策略范式以及大型语言模型来实现训练、推理和评估。

☆一键收藏:

https://sota.jiqizhixin.com/project/llama-o1


②项目:In-Context LoRA

In-Context LoRA是一个用于扩散transformer的项目,旨在通过微调文本到图像模型来生成具有可定制内在关系的图像集。该项目允许在生成过程中基于另一个图像集进行条件化,从而实现任务无关的自适应,适用于广泛的应用场景。

☆一键收藏:

https://sota.jiqizhixin.com/project/in-context-lora


③项目:FlowToken

FlowToken 是一个 React 组件库,旨在增强大语言模型(LLM)文本流的视觉呈现。该库提供多种动画效果,使文本以平滑和动态的方式出现,从而提供引人入胜的用户体验。FlowToken 兼具响应性和轻量级,优化了性能并兼容所有现代浏览器。

☆一键收藏:

https://sota.jiqizhixin.com/project/flowtoken


④项目:Paper Reviewer

Paper Reviewer项目利用大语言模型(LLMs)和文档解析工具从学术论文中提取信息。该项目为AI Paper Reviewer网站提供支持,旨在通过自动化的方式解析论文内容,提取图像、描述、章节细节和参考文献等信息,以提高论文审阅的效率和准确性。

☆一键收藏:

https://sota.jiqizhixin.com/project/paper-reviewer



机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
 最新文章