从文本到音频和计算机视觉：解锁 Hugging Face Pipelines 的无限可能

文摘 2024-08-20 07:01 湖南

在机器学习和深度学习的应用中，模型推理是一个重要的环节。为了让更多人能够简便地使用强大的模型，Hugging Face 提供了 Pipelines（管道）这一工具。Pipelines 是 Transformers 库中的抽象对象，它们简化了复杂的代码，提供了一个简单的 API 来执行诸如命名实体识别、掩码语言建模、情感分析、特征提取和问答等任务。

一、Pipeline API

Pipeline API 是对所有可用管道的包装。它可以像其他任何管道一样实例化，并且大大降低了 AI 推理的学习和使用成本。

使用 Pipeline API 实现 Text Classification 任务

1. Text Classification（文本分类）

文本分类任务将一个文本序列（句子级别、段落或整篇文章）标记为预定义的类别之一。文本分类有许多实际应用，包括：

情感分析：根据某种极性（如积极或消极）对文本进行标记，以在政治、金融和市场等领域支持决策制定。
内容分类：根据主题对文本进行标记，以帮助组织和过滤新闻和社交媒体信息流中的信息（如天气、体育、金融等）。

下面是如何使用 Pipeline API 进行情感分析的示例代码：

from transformers import pipeline
# 创建情感分析管道nlp = pipeline("sentiment-analysis")
# 对文本进行情感分析result = nlp("I love using the new transformer models!")print(result)

在这个示例中，我们使用 pipeline 函数创建了一个情感分析管道。传入字符串 "sentiment-analysis" 作为参数，创建的管道可以用于情感分析。随后，我们将一段文本传递给管道，获取并打印分析结果。

二、使用 Pipeline API 调用更多预定义任务

1. Token Classification（Token 分类）

在任何 NLP 任务中，文本都经过预处理，将文本序列分成单个单词或子词（tokens）。Token Classification 将每个 token 分配一个来自预定义类别集的标签。常见的 Token 分类任务包括：

命名实体识别（NER）：根据实体类别（如组织、人员、位置或日期）对 token 进行标记。
词性标注（POS）：根据词性（如名词、动词或形容词）对 token 进行标记。

以下是如何使用 Pipeline API 进行命名实体识别的示例代码：

from transformers import pipeline
# 创建命名实体识别管道nlp_ner = pipeline("ner")
# 对文本进行命名实体识别result = nlp_ner("Hugging Face Inc. is a company based in New York City.")print(result)

在这个示例中，我们创建了一个命名实体识别（NER）管道，并将输入文本传递给它。结果将显示文本中的实体及其类别（如公司、位置等）。

2. Question Answering（问答）

问答任务返回一个问题的答案，有时带有上下文（开放领域），有时不带上下文（封闭领域）。常见的问答类型包括：

提取式问答：给定一个问题和一些上下文，模型从上下文中提取出一段文字作为答案。
生成式问答：给定一个问题和一些上下文，模型根据上下文生成答案。

以下是一个提取式问答的示例代码：

from transformers import pipeline
# 创建问答管道qa_pipeline = pipeline("question-answering")
# 定义问题和上下文question = "What is the capital of France?"context = "France is a country in Europe. The capital of France is Paris."
# 获取答案result = qa_pipeline(question=question, context=context)print(result)

在这个示例中，我们创建了一个问答管道，并提供了一个问题和相关的上下文。模型将根据上下文提取并返回问题的答案。

3. Summarization（文本摘要）

文本摘要任务从较长的文本中创建一个较短的版本，同时尽可能保留原始文档的大部分含义。摘要任务主要有以下两种类型：

提取式摘要：从原始文本中识别和提取最重要的句子。
生成式摘要：从原始文本中生成目标摘要（可能包括输入文件中没有的新单词）。

以下是一个文本摘要的示例代码：

from transformers import pipeline
# 创建文本摘要管道summarizer = pipeline("summarization")
# 对文本进行摘要text = """Hugging Face Inc. is a company based in New York City. Its headquarters are located in DUMBO, therefore very close to the Manhattan Bridge."""result = summarizer(text)print(result)

在这个示例中，我们创建了一个文本摘要管道，并传递了一段较长的文本。模型将生成一个简短的摘要。

三、Audio 音频处理任务

1. Audio Classification（音频分类）

音频分类任务将音频数据标记为预定义的类别之一。常见的音频分类任务包括：

声学场景分类：使用场景标签（如“办公室”、“海滩”、“体育场”）对音频进行标记。
声学事件检测：使用声音事件标签（如“汽车喇叭声”、“鲸鱼叫声”、“玻璃破碎声”）对音频进行标记。

以下是如何使用 Pipeline API 进行音频分类的示例代码：

from transformers import pipeline
# 创建音频分类管道audio_classifier = pipeline("audio-classification")
# 对音频文件进行分类result = audio_classifier("path_to_audio_file.wav")print(result)

在这个示例中，我们创建了一个音频分类管道，并传递了一个音频文件路径。模型将音频文件进行分类并返回结果。

2. Automatic Speech Recognition（ASR 自动语音识别）

ASR 将语音转录为文本，是最常见的音频任务之一。ASR 系统嵌入在许多智能技术产品中，如扬声器、电话和汽车。Transformer 架构在低资源语言的自动语音识别中表现尤为出色。

以下是如何使用 Pipeline API 进行自动语音识别的示例代码：

from transformers import pipeline
# 创建语音识别管道asr_pipeline = pipeline("automatic-speech-recognition")
# 对音频文件进行语音识别result = asr_pipeline("path_to_audio_file.wav")print(result)

在这个示例中，我们创建了一个自动语音识别（ASR）管道，并传递了一个音频文件路径。模型将音频转录为文本并返回结果。

四、Computer Vision 计算机视觉

1. Image Classification（图像分类）

图像分类任务将整个图像标记为预定义的类别之一。常见的应用包括：

医疗保健：标记医学图像以检测疾病或监测患者健康状况。
环境监测：标记卫星图像以监测森林砍伐、提供野外管理信息或检测野火。
农业监测：标记农作物图像以监测植物健康状况。

以下是如何使用 Pipeline API 进行图像分类的示例代码：

from transformers import pipeline
# 创建图像分类管道image_classifier = pipeline("image-classification")
# 对图像文件进行分类result = image_classifier("path_to_image_file.jpg")print(result)

在这个示例中，我们创建了一个图像分类管道，并传递了一张图像文件路径。模型将图像进行分类并返回结果。

2. Object Detection（目标检测）

目标检测任务在图像中识别多个对象以及这些对象在图像中的位置（由边界框定义）。常见的应用包括：

自动驾驶车辆：检测交通对象，如其他车辆、行人和红绿灯。
遥感：用于灾害监测、城市规划和天气预报。
缺陷检测：检测建筑物中的裂缝或结构损坏，以及制造业产品缺陷。

以下是如何使用 Pipeline API 进行目标检测的示例代码：

from transformers import pipeline
# 创建目标检测管道object_detector = pipeline("object-detection")
# 对图像文件进行目标检测result = object_detector("path_to_image_file.jpg")print(result)

在这个示例中，我们创建了一个目标检测管道，并传递了一张图像文件路径。模型将识别图像中的多个对象及其位置。

通过使用 Pipelines，复杂的模型推理变得更加简单和易上手。无论是 NLP、音频处理还是计算机视觉，Pipelines 都能帮助你快速实现高效的模型推理。

http://mp.weixin.qq.com/s?__biz=Mzg5Mjc3NTg1Mw==&mid=2247485114&idx=1&sn=3c6a489be0cc279f7c96f127d50b21bf

智能体AI

1、大模型只有结合业务才有意义，做出有价值的应用才是王道。2、基于大模型的开发要和传统程序结合。3、程序员的价值暴跌。4、产品经理的价值暴增。你需要及时更新自己的认知，帮大模型产品找到合理的价值主张。提供项目管理和AI应用的咨询服务。

最新文章

探索智能客服背后的黑科技：从语义分析到精准匹配

金融科技突破口：深度解析金融AI原生平台四层架构详解

大模型研发全揭秘（八）：模型训练全流程详解（从参数设置到优化调整-附代码）

大模型研发全揭秘（七）：如何通过正确初始化提升训练效果？

大模型研发全揭秘（六）：AI模型设计的五大关键步骤

大模型研发全揭秘（五）：如何通过数据集的合理划分提升大模型的表现？

大模型研发全揭秘（四）：客服工单数据标注的完整攻略

构建高效AI中台：解析人工智能中台架构的五大核心层

如何成为优秀的产品经理：技术与观念的完美融合

大模型研发全揭秘（三）：如何提升AI系统数据质量？数据清洗与预处理的关键步骤与案例解析！

大模型研发全揭秘（二）：数据决定模型成败！如何确保数据采集不踩坑？

大模型研发全揭秘（一）：掌握AI项目成功的10个关键步骤

运维智能体详解：如何通过智能化提升企业运维效率

人工智能新篇章：大语言模型如何赋能千行百业

AI赋能电商：AI大模型如何引领电商行业变革？

AI产品经理必备技能：如何从需求挖掘到智能化产品落地

人工智能赋能医疗：深度探索AI医疗产品的创新架构

从AI助手到自主Agent场景分析：项目经理如何选择最适合的LLM策略？

如何为你的大模型应用选择最佳架构？六大模式全面解读

AI四层架构解析：医疗AI如何深度融合各大应用场景

AI赋能教育：智慧教育技术架构的解析

AI产品经理知识体系：驾驭未来的核心技能

AI如何让销售更智能更精确？AI赋能销售的全流程深度解析

深度解析智能问答系统：如何打造精准、高效的AI对话架构？

AI人工智能整体架构：企业智能化转型的核心引擎

实战 Transformers 模型微调之数据集处理库 Hugging Face Datasets

从文本到音频和计算机视觉：解锁 Hugging Face Pipelines 的无限可能

高效AI故障诊断实践：提升企业运维能力

从异常感知到故障处理：多Agent（智能体）在故障处理中的应用

探索智能问答场景中的Agent角色

大模型解决运维之痛：从日志识别到自动化执行的全链路优化

大模型微调实战演练：使用代码剖析 Transformers Pipelines工作原理

从零开始：如何使用 Hugging Face Transformers 进行大模型开发

从LoRA到QLoRA：量化技术如何改变预训练模型的微调方式

LoRA 的进化之路：AdaLoRA 的技术突破

AI赋能运维：AI Agent在运维场景中的应用

探索AI技术的全景视图：从基础设施到应用层

一文看懂LoRA：如何在保持高效的同时提升微调效果

如何构建高效的智能应用：大模型五层技术架构详解

AI赋能客户服务：智能知识问答系统的架构解析

从PEFT到未来：大模型微调的高效新方法全面揭秘！

AI Agent 如何颠覆传统运维模式？

如何构建高效的智能应用：大模型五层技术架构详解

探索人工智能技术的四个阶段：从提示工程到预训练技术

LoRA、QLoRA与AdaLoRA的低秩适配：如何让AI语言模型瘦身不减智？

如何高效微调大模型？五大前沿 PEFT 技术为你揭晓

自主智能体的未来：LangChain Agents如何实现复杂任务自动化

一文读懂预训练语言模型的三大架构

全量微调vs高效微调：哪种方法更适合你的AI项目？

国产AI的崛起与全球科技版图的重塑

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉