腾讯活菩萨？最强大模型开源，免费商用。

科技 2024-11-06 19:42 河南

腾讯混元Large模型总参数量约389B，激活参数量约52B ，上下文长度达256k，是当前业界参数规模最大、效果最好的Transformer架构的开源MoE模型，更适配开源框架精调和部署。

大家好，我是章北海

最近腾讯在大模型开源社区风头很盛

前两天又开源了混元-Large 模型：Hunyuan-A52B-Pretrain，Hunyuan-A52B-Instruct 和 Hunyuan-A52B-FP8，可支持企业及开发者精调、部署等不同场景的使用需求，可在 HuggingFace、Github 等技术社区直接下载，免费可商用。

我简单看了一下，申请了api，走了一遍开发全流程，这里简单介绍一下。

简介
测试
开发

简介

技术创新点

采用随机补偿的路由方式，将由于专家满负载原本会丢弃的专家随机路由到其他仍有负载冗余的专家，同时提升模型的训练稳定性和收敛速度。

采用Grouped-Query Attention(GQA)和Cross-Layer Attention (CLA)两种策略，对KV Cache进行了压缩。Hunyuan-Large模型的head数通过GQA从80压缩到8，并通过CLA每两层共用KV激活值，最终将模型的KV Cache压缩为MHA的5%，大幅提升推理性能。

模型性能遥遥领先

Hunyuan-Large在与业界开源的DeepSeek-V2 、Llama3.1-70B、Llama3.1-405B以及Mixtral-8x22B的对比中，在CMMLU、MMLU、CEval等多学科综合评测集、中英文NLP任务、代码和数学等9大维度全面领先，处于行业领先水平。

测试

官方提供了测试地址：https://huggingface.co/spaces/tencent/Hunyuan-Large

可以简单提问，但是复杂问题报error

额外说一句，这样的chatbot其实开发起来很简单，都是用Gradio开发的，代码如下：

import os
import gradio as gr
import json
import types
from tencentcloud.common import credential
from tencentcloud.common.profile.client_profile import ClientProfile
from tencentcloud.common.profile.http_profile import HttpProfile
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.hunyuan.v20230901 import hunyuan_client, models


def respond(
    message,
    history: list[tuple[str, str]],
    system_message,
    max_tokens,
    temperature,
    top_p,
):
    default_system = 'You are a helpful assistant.'

    messages = [{"Role": "system", "Content": default_system}]

    secret_id = os.getenv('SECRET_ID')
    secret_key = os.getenv('SECRET_KEY')
    

    cred = credential.Credential(secret_id, secret_key)
    httpProfile = HttpProfile()
    httpProfile.endpoint = "hunyuan.tencentcloudapi.com"
    clientProfile = ClientProfile()
    clientProfile.httpProfile = httpProfile
    client = hunyuan_client.HunyuanClient(cred, "", clientProfile)
    req = models.ChatCompletionsRequest()

    for val in history:
        if val[0]:
            messages.append({"Role": "user", "Content": val[0]})
        if val[1]:
            messages.append({"Role": "assistant", "Content": val[1]})

    messages.append({"Role": "user", "Content": message})

    params = {
        "Model": "hunyuan-large",
        "Messages": messages,
        "Stream": True,
        "StreamModeration": True,
        "EnableEnhancement": False,
    }
    req.from_json_string(json.dumps(params))

    resp = client.ChatCompletions(req)

    response = ""

    for event in resp:
        data = json.loads(event['data'])
        token = data['Choices'][0]['Delta']['Content']

        response += token
        yield response



demo = gr.ChatInterface(
    respond,
    title="Hunyuan-Large"
)


if __name__ == "__main__":
    demo.launch()

开发

本地部署我没有实力，机器性能hold不住

可以申请 api_key，用SDK接入

https://console.cloud.tencent.com/hunyuan

个人建议用OpenAI SDK方式接入

❝
混元 API 兼容了 OpenAI 的接口规范，这意味着您可以直接使用 OpenAI 官方提供的 SDK 来调用混元大模型。您仅需要将 base_url 和 api_key 替换成混元的相关配置，不需要对应用做额外修改，即可无缝将您的应用切换到混元大模型。

官方赠送了100万token免费资源包

官方也提供了Python、NodeJS、Golang的开发示例

下面是 Python 示例

import os
from openai import OpenAI

# 构造 client
client = OpenAI(
    api_key=os.environ.get("HUNYUAN_API_KEY"), # 混元 APIKey
    base_url="https://api.hunyuan.cloud.tencent.com/v1", # 混元 endpoint
)


# 自定义参数传参示例
completion = client.chat.completions.create(
    model="hunyuan-pro",
    messages=[
        {
            "role": "user",
            "content": "你好",
        },
    ],
    extra_body={
        "key": value, # <- 自定义参数
    },
)

我把他配置到了沉浸式翻译

后续感受，再向大家分享。

更多参考资料如下：

论文：https://arxiv.org/abs/2411.02265
官网：https://llm.hunyuan.tencent.com/
代码：https://github.com/Tencent/Hunyuan-Large
测试：https://huggingface.co/spaces/tencent/Hunyuan-Large
模型：https://huggingface.co/tencent/Tencent-Hunyuan-Large/tree/main 文档：https://cloud.tencent.com/document/product/1729 API ：https://cloud.tencent.com/product/hunyuan

模型篇P1:机器学习基本概念

迄今最好的AI代码编辑器，编程只需狂按Tab

【大模型实战，完整代码】AI 数据分析、可视化项目

108页PDF小册子：搭建机器学习开发环境及Python基础

116页PDF小册子：机器学习中的概率论、统计学、线性代数

全网最全 Python、机器学习、AI、LLM 速查表（100 余张）

Obsidian AI写作神器：一键配置DeepSeek，写作效率飙升1000%！

基于 QAnything 的知识库问答系统：技术解析与应用实践【附代码】

⬆️关注：领取Python、机器学习资料包⬆️

http://mp.weixin.qq.com/s?__biz=MzA4MjYwMTc5Nw==&mid=2648992273&idx=1&sn=96151eb3d038052cfddf7b135d4bc7d4

机器学习算法与Python实战

长期跟踪关注统计学、数据挖掘、机器学习算法、深度学习、人工智能技术与行业发展动态，分享Python、机器学习等技术文章。回复机器学习有惊喜资料。

最新文章

值得开发者好好看一看的AI大模型入门教程（内含300道AI面试真题）

50K*16薪，进字节了！

教授何恺明在MIT的第二门课——《深度生成模型》，PPT陆续已出

机器学习进阶必备-10 个高效 Python 工具包完全指南

再见 EasyExcel ！

【赠】出书了，《破解深度学习》来了！

大模型发展方向，你绝对想不到！

机器学习数据预处理中的数据泄露问题！

【RAG实战】基于TextIn打造上市公司财务报表智能问答系统

涨点神器！100个即插即用缝合模块【合集下载】

手搓AI大模型应用获25万用户，辞职创业，收入不如摆摊，网友建议：重新进厂打工

腾讯活菩萨？最强大模型开源，免费商用。

面了一个字节50k大佬，见识到了基础天花板！

微软研究院出品：让 GPT-4V秒懂屏幕截图，本地部署

面了一个字节50k大佬，见识到了基础天花板！

微软研究院出品：让 GPT-4V秒懂屏幕截图，本地部署

15岁山东初中生做CTO，开源项目被100万收购

继续折腾 Obsidian，本地部署one-api，畅通免费大模型

100+深度学习各方向数据集资源大盘点

深度学习面试题合集（PDF下载）

AI 证件照制作工具

神经网络首看书《神经网络与机器学习》，中英文版本PDF下载

被李宏毅大神点赞，深度学习详解，开源了

Anthropic官方深入探讨prompt工程 | 全文脱水中文版

算法入门，《算法图解（第2版）》终于来了！

分享 7 个用 Python 开发成的数据库

“院士之乡”：一共走出26位院士，百位高校校长，一万名教授

黄仁勋预言成真了！！

黑神话火后，印度人想偷走“孙悟空”！疯狂篡改维基百科？

一文读懂模型的可解释性（附代码）

华为牛逼！用 AI 操作手机，做出来了

现在入局 AI 真不晚！

纯血版鸿蒙，扬名海外！国产操作系统的新时代，就要来了。

一个超强的构建Agent的大模型框架

Numpy中数组和矩阵操作的数学函数

RAG入门与实战

10 分钟掌握 Pandas 核心操作：从零开始的数据分析实战

统计学神书，中文版，来了

一网打尽！欧式、曼哈顿、切比雪夫距、闵可夫斯基、汉明、杰拉德、相关距离......原理与可视化解析，附Python代码

【免费PDF下载】数学推导，7万字学会支持向量机

AI 觉醒，学会模仿人类用电脑！编程吊打OpenAI o1

斯坦福NLP实验室重磅开源：DSPy，让大模型开发更简单，附代码

香港大学最新成果——LightRAG大，幅降低大模型问答成本

【PDF下载】无监督机器学习：200页的练习册

被导师放养，后果可能很严重。。。

从A到Z，一文通览Python所有内置函数：编程效率提升 100%

大模型 + 推荐系统，代码实战

【PDF免费下载】一本概率论入门教程，本科生难度

Python字符串操作：常用方法和高级技巧

清华大学开源了！深度学习编译器MagPy

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉