人工智能 | 阿里通义千问大模型

文摘 2024-10-21 08:00 北京

简介

通义千问系列模型为阿里云研发的大语言模型。千问模型基于 Transformer 架构，在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。同时，在预训练模型的基础之上，使用对齐机制打造了模型的 chat 版本。其中千问-1.8B 是 18 亿参数规模的模型，千问-7B 是 70 亿参数规模的模型，千问-14B 是 140 亿参数规模的模型，千问-72B 是 720 亿参数规模的模型。

Qwen1.5

Qwen1.5 是 Qwen 开源系列的下一个版本。与之前的版本相比，Qwen1.5 显著提升了聊天模型与人类偏好的一致性，改善了它们的多语言能力，并具备了强大的链接外部系统能力。DashScope 上提供 API 服务的是新版本 qwen 模型的 chat 版本，在 chat 能力上大幅提升，即便在英文的 MT-Bench 上，Qwen1.5-Chat 系列也取得了优秀的性能。

Qwen2

Qwen2 参数范围包括 0.5B 到 72B，包括 MOE 模型。Qwen2 在一系列针对语言理解、语言生成、多语言能力、编码、数学、推理等的基准测试中总体上超越了大多数开源模型，并表现出与专有模型的竞争力。Qwen2 增⼤了上下⽂⻓度⽀持，最⾼达到 128K tokens（Qwen2-72B-Instruct），能够处理大量输入

千问 2 性能

文生文本地部署 ollama

Qwen2-72B-Instruct-demo 在线体验

Qwen2-VL ModelScope

Qwen2-VL 可以处理任意图像分辨率，将它们映射到动态数量的视觉标记中，提供更接近人类的视觉处理体验

Qwen2-VL 模型特点

读懂不同分辨率和不同长宽比的图片：Qwen2-VL 在 MathVista、DocVQA、RealWorldQA、MTVQA 等视觉理解基准测试中取得了全球领先的表现。
理解 20 分钟以上的长视频：Qwen2-VL 可理解长视频，并将其用于基于视频的问答、对话和内容创作等应用中。
能够操作手机和机器人的视觉智能体：借助复杂推理和决策的能力，Qwen2-VL 可集成到手机、机器人等设备，根据视觉环境和文字指令进行自动操作。
多语言支持：为了服务全球用户，除英语和中文外，Qwen2-VL 现在还支持理解图像中的多语言文本，包括大多数欧洲语言、日语、韩语、阿拉伯语、越南语等。

本地部署示例

本地处理视频分析

Qwen2-VL ModelScope 在线体验

langchain 调用阿里云 api

from langchain_community.chat_models import ChatTongyifrom langchain_core.messages import HumanMessage
chatLLM = ChatTongyi(model_name="qwen-vl-max")image_message = {    "image": "https://lilianweng.github.io/posts/2023-06-23-agent/agent-overview.png",}text_message = {    "text": "summarize this picture",}message = HumanMessage(content=[text_message, image_message])chatLLM.invoke([message])

token 消耗统计

content=[{'text': '图中是一位身穿黄色衣服的女子站在床边喂一个男人喝药。女人身穿一身黄色旗袍，上面绣着精美的花纹。男人躺在床上似乎很虚弱的样子。'}] response_metadata={'model_name': 'qwen-vl-max', 'finish_reason': 'stop', 'request_id': '777814e2-873c-93c8-a280-eea5e91f59f1', 'token_usage': {'input_tokens': 335, 'output_tokens': 39, 'image_tokens': 299}} id='run-7708852a-7069-4940-9b25-9bcda0e99e10-0'

代码调用 transformers + modelscope

from PIL import Imageimport requestsimport torchfrom torchvision import iofrom typing import Dictfrom transformers import Qwen2VLForConditionalGeneration, AutoTokenizer, AutoProcessorfrom modelscope import snapshot_download
from utils import debug
model_dir = snapshot_download("qwen/Qwen2-VL-7B-Instruct")# Load the model in half-precision on the available device(s)model = Qwen2VLForConditionalGeneration.from_pretrained(    model_dir, torch_dtype="auto", device_map="auto")processor = AutoProcessor.from_pretrained(model_dir)

def test_image():    # Image    url = "https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-VL/assets/demo.jpeg"    image = Image.open(requests.get(url, stream=True).raw)
    conversation = [        {            "role": "user",            "content": [                {                    "type": "image",                },                {"type": "text", "text": "Describe this image."},            ],        }    ]
    # Preprocess the inputs    text_prompt = processor.apply_chat_template(conversation, add_generation_prompt=True)    # Excepted output: '<|im_start|>system\nYou are a helpful assistant.<|im_end|>\n<|im_start|>user\n<|vision_start|><|image_pad|><|vision_end|>Describe this image.<|im_end|>\n<|im_start|>assistant\n'
    inputs = processor(        text=[text_prompt], images=[image], padding=True, return_tensors="pt"    )    inputs = inputs.to("cuda")
    # Inference: Generation of the output    output_ids = model.generate(**inputs, max_new_tokens=128)    generated_ids = [        output_ids[len(input_ids):]        for input_ids, output_ids in zip(inputs.input_ids, output_ids)    ]    output_text = processor.batch_decode(        generated_ids, skip_special_tokens=True, clean_up_tokenization_spaces=True    )    debug(output_text)

总结

功能相对齐全，文本、音频、图片、视频都比较开放
在线服务完善阿里云、魔搭、海外平台集成
开放性高，开源，可私有部署

http://mp.weixin.qq.com/s?__biz=MzU3NDM4ODEzMg==&mid=2247533884&idx=1&sn=e6810a9049a7019daf6aaeeff366f1fb

霍格沃兹测试学院

霍格沃兹测试学院致力于培养专业的测试人才，推动测试行业的技术更新和发展，我们本着此宗旨，为您提供测试技术培训和实战，让您真正的可以在测试能力上获得提升。

最新文章

名企测试管理大咖解析沟通管理，多维度经验分享

人工智能 | 检索增强生成(RAG)

人工智能 | ReACT 推理模式

精准测试如何落地

限时优惠进行中 | AI自动化班，全面解锁AI自动化技能

人工智能 | 文生视频大模型

11.11 大促，测试人什么值得买？

测试人生 | 90后斩获多家名企offer的小哥哥，做对了什么？

人工智能 | 文生图大模型

公开课 | Playwright：掌握Web自动化测试的新利器

第二届全国高校软件测试开发教育峰会在韩山师范学院隆重举办！

测试开发岗位就业与内推指导公开课

测试外包服务 | 从人员外包到测试工具、测试平台，提供全方位的测试解决方案~

大咖公开课 | 解锁Kafka等消息队列中间件的测试之道

人工智能 | 语音识别模型

人工智能 | 智谱 AI 大模型

测试人生 | 被裁员后人生低谷到绝处逢生，薪资怒涨近40%

【限时免费试听】高薪测试开发私教班，小班私教，抢鲜体验！

公开课 | AI赋能自动化测试：解锁未来测试新篇章

测试热招职位技能要求拆解公开课 —— 开启你的软件测试进阶之路

小班私教本周日，开放深圳线下试听，座位有限，先到先得

公开课 | AI赋能自动化测试：解锁未来测试新篇章

测试热招职位技能要求拆解公开课 —— 开启你的软件测试进阶之路

人工智能 | 阿里通义千问大模型

测试人生 | 双非院校，2年工作经验年薪近20万

人工智能 | mixtral大模型

人工智能 | openai chatgpt 大语言模型

公开课 | 金九银十，测试开发面试秘籍大公开！

免费试听 | 深圳测试开发高薪线下周末班即将开班，从自动化到测试平台开发，职场进阶快人一步

基于 LangChain 的自动化测试用例的生成与执行

人工智能 | 手工测试用例转Web自动化测试生成

公开课 | AI赋能自动化测试：解锁未来测试新篇章

马上开营 | 人工智能测试开发训练营带你解锁AI测试新技能，跃升职场新高度！

人工智能 | 手工测试用例生成

岗位内推 | 京东、快手、美团、百度、淘天集团、联想招人啦~

性能测试 | JMeter的运行

【紧急召集】大咖领衔，2天AI创业创收训练营即刻启程！不要错过，速来占位！

基于LangChain手工测试用例转App自动化测试生成工具

人工智能 | 基于ChatGPT开发人工智能服务平台

测试人生 | 手工转测试开发轻松实现薪资 50%涨幅的逆袭之路

人工智能 | ChatGPT 插件开发

性能测试 | JMeter 介绍与安装

公开课 | 金九银十，测试开发面试秘籍大公开！

人工智能 | 搭建企业内部的大语言模型系统

人工智能 | Hugging Face 的应用

公开课 | 测试工程师的质量体系构建指南

人工智能 | 大语言模型应用框架介绍

人工智能 | Mistral 大语言模型

人工智能 | MetaLlama大模型

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉