Datawhale分享
最新:智谱AI,实体清单影响
和前天如出一辙的公告又来了!刚刚,美国首个全球 AI 禁令正式颁布!
而现在,美国对中国 AI 的限制正在从芯片蔓延到其他领域。
就在凌晨,美国商务部工业和安全局(BIS)更新了出口管制实体清单。
更新的出口管制实体清单中,就新增了「智谱 AI」。
智谱 AI 被全面拉黑
在 BIS 的第一份文档中,将 11 家中国 AI 企业列入实体清单,其中 10 家实体均是智谱旗下的。
文件中列出的理由是:
「掌握全链路大模型核心技术」,自主可控是智谱的底气。
不惧制裁,连发三大模型
这样的话想象空间就非常大了,想象以后的 agent,每个人都会拥有一个 AI 的管家,帮大家去做一些相关的现实生活中的问题,比如你想去北京玩,它能告诉你天气,还能帮你订酒店。
GLM-4-Air 全面升级
智谱 AI 基于对话和文本创作的实际需求,对 GLM-4-Air 进行全方位升级,进而诞生了 GLM-4-Air-0111。
此版本对训练数据与流程进行深度优化,通过算法改进,在某些维度可以取得与规模更大的模型GLM-4-Plus接近的性能。
同时,模型配置却保持精简,有效避免了资源的过度占用。值得一提的是,相较于前代,它的调用费用降低了一半,显著减轻了开发和部署的成本压力。
GLM-4V-Plus 全面升级
GLM-4V-Plus 则升级了视觉理解能力。
新版本具备长达2小时的视频理解能力;同时具有广泛的兼容性。它可以处理 224×224 的低分辨率图像,也能应对 4K 超清的高分辨率图像,对于极长宽比图像也能适配。
在保证高效识别的同时,GLM-4V-Plus 减少了 Token 消耗。
在多个公开榜单测试中,GLM-4V-Plus 相较于之前版本有明显的效果提升。
加速全民 AI,发出中国声
智谱设置了针对全社会免费开放 Flash 系列普惠模型 API。作为行业首个全模态的免费系列模型,开发者可以免费调用语言、多模态理解、多模态生成功能。
目前智谱已经开放了全新的「Flash全模态全家桶」供大家使用,分别是:
GLM-4-Flash 语言模型:适用于智能问答、摘要生成和文本数据处理等场景。
GLM-4V-Flash 图像理解模型:适用于图像识别、图像问答、图像推理等场景。
Cogview-3-Flash图像生成模型:应用于艺术创作、设计参考、游戏开发、虚拟现实等领域。
CogVideoX-Flash视频生成模型:支持文生视频,依据输入的文本描述生成相应的动态视频内容;还支持图生视频,能够对输入的图片进行深度解析,提取图片中的关键信息、元素特征及潜在语义。
面对美国的限制,智谱 AI 不仅没有退缩,反而加速前行。
连发三大模型、升级普惠模型,都在为全民 AI 时代添砖加瓦。
凭能力解开实体的束缚,发出中国声。
期待在智谱的推动下,AI 能真正融入生活、工作、行业场景,为世界带来更多惊喜与改变。
One More Thing
支持国产大模型,从我做起。
Datawhale 贴心地给大家准备了「智谱 AI」动手实践教程(入门篇)。
笔者是 Datawhale 成员、教育领域的工作人员,我这边就以我的视角给大家展示一些智谱免费模型的效果。
这里我教大家 GLM-4V-Flash 模型批改作业~
其他的模型及方案会在教程中更新,教程地址:https://spvrm23ffj.feishu.cn/docx/V9gidaXRyohRMBxWDIycSru6n5g
△ 批改作业
GLM-4V-Flash
import gradio as gr
import base64
from zhipuai import ZhipuAI
# 初始化API客户端
api_key ="" # 替换为您的实际 API Key
client = ZhipuAI(api_key=api_key)
# 定义问答逻辑
def ask_question(image_path, text_input):
try:
# 读取图片并转换为 Base64 编码
with open(image_path, 'rb') as img_file:
img_base = base64.b64encode(img_file.read()).decode('utf-8')
# 构造消息内容
messages = [
{
"role": "user",
"content": [
{"type": "image_url", "image_url": {"url": img_base}},
{"type": "text", "text": text_input},
],
}
]
# 调用模型接口
response = client.chat.completions.create(
model="glm-4v-flash",
messages=messages,
)
# 获取助手的回复内容
assistant_message = response.choices[0].message.content
except Exception as e:
assistant_message = f"调用模型时发生错误:{e}"
return assistant_message
# 创建Gradio界面
with gr.Blocks() as demo:
gr.Markdown("# 智谱AI问答界面")
gr.Markdown("上传图片并输入问题,让AI为您解答。")
# 输入组件
image_input = gr.Image(type="filepath", label="上传图片")
text_input = gr.Textbox(label="输入问题", placeholder="例如:请描述这个图片")
submit_button = gr.Button("提交")
# 输出组件
output = gr.Textbox(label="AI回复")
# 定义交互逻辑
submit_button.click(ask_question, inputs=[image_input, text_input], outputs=output)
# 启动Gradio应用
demo.launch()