Semantic Kernel:图识文

文摘 2024-08-06 07:30 日本

多模态是每个LLM具有的能力，图片又是最常见的信息载体，GPT对图片的识别也很早就有了，随着GPT版本的迭代，效果越来越好。SK也是在很多就适配了图识文，只不过最近版本才支持本地图片的上传。（有点晚）

图片场景识别：

using Microsoft.SemanticKernel.ChatCompletion;using Microsoft.SemanticKernel;using Microsoft.SemanticKernel.Connectors.OpenAI;
var chatModelId = "gpt-4o";var key = File.ReadAllText(@"C:\GPT\key.txt");#pragma warning disable SKEXP0070#pragma warning disable SKEXP0010#pragma warning disable SKEXP0001#pragma warning disable SKEXP0110var kernel = Kernel.CreateBuilder()   .AddOpenAIChatCompletion(chatModelId, key)   .Build();
var chat = kernel.GetRequiredService<IChatCompletionService>();var chatHistory = new ChatHistory();chatHistory.AddUserMessage(new ChatMessageContentItemCollection{     new TextContent("请说明这是那里，什么样的天气，大家在干什么?一共有多少人"),     new ImageContent(File.ReadAllBytes("tam.jpg"),"image/jpeg")});var settings = new Dictionary<string, object>{    ["max_tokens"] = 1000,    ["temperature"] = 0.2,    ["top_p"] = 0.8,    ["presence_penalty"] = 0.0,    ["frequency_penalty"] = 0.0};
var content = chat.GetStreamingChatMessageContentsAsync(chatHistory, new PromptExecutionSettings{    ExtensionData = settings});await foreach (var item in content){    Console.Write(item.Content);}Console.ReadLine();

图片：

结果：

文字识别：

using Microsoft.SemanticKernel.ChatCompletion;using Microsoft.SemanticKernel;using Microsoft.SemanticKernel.Connectors.OpenAI;
var chatModelId = "gpt-4o";var key = File.ReadAllText(@"C:\GPT\key.txt");#pragma warning disable SKEXP0070#pragma warning disable SKEXP0010#pragma warning disable SKEXP0001#pragma warning disable SKEXP0110var kernel = Kernel.CreateBuilder()   .AddOpenAIChatCompletion(chatModelId, key)   .Build();
var chat = kernel.GetRequiredService<IChatCompletionService>();var chatHistory = new ChatHistory();chatHistory.AddUserMessage(new ChatMessageContentItemCollection{     new TextContent("请识别图片上的文字，并输出"),     new ImageContent(File.ReadAllBytes("japancard.png"),"image/jpeg")});var settings = new Dictionary<string, object>{    ["max_tokens"] = 1000,    ["temperature"] = 0.2,    ["top_p"] = 0.8,    ["presence_penalty"] = 0.0,    ["frequency_penalty"] = 0.0};
var content = chat.GetStreamingChatMessageContentsAsync(chatHistory, new PromptExecutionSettings{    ExtensionData = settings});await foreach (var item in content){    Console.Write(item.Content);}Console.ReadLine();

图片：

结果：

http://mp.weixin.qq.com/s?__biz=MzA3NDM1MzIyMQ==&mid=2247488312&idx=1&sn=81b481d4a5f0779d944b1f18d9b5d8ec

桂迹

分享原创，记录痕迹！

最新文章

ASP.NET Core 知识速递 - Day 9：HTTP响应顺序，先头后尾

.NET9里WinForm更新了什么

SemanticKernel系列，AI系列，SmartFill介绍视频系列

更流畅的asp.net api的错误返回

用.srt字幕文件生成.wav语音

自制实时翻译小工具

ASP.NET Core 知识速递 - Day 8：每天进步一点

Semantic Kernel：图片向量化

ASP.NET Core 知识速递 - Day 7：每天进步一点

ASP.NET Core 知识速递 - Day 6：每天进步一点

Semantic Kernel：Plugins

Semantic Kernel：Function Calling

ASP.NET Core 知识速递 - Day 5：每天进步一点

ASP.NET Core 知识速递 - Day 4：每天进步一点

ASP.NET Core 知识速递 - Day 3：每天进步一点

Semantic Kernel：SK中的Function

Semantic Kernel：使用PostgreSQL作为向量化库

.NET9让指标更纯正

ASP.NET Core 知识速递 - Day 2：每天进步一点

Semantic Kernel:Agent代理

ASP.NET Core 知识速递 - Day 1：每天进步一点

将Azure Open AI集成到应用程序中

Semantic Kernel:文转图

使用Azure OpenAI服务创建聊天会话

提升邮件发送效率：必备的 ASP.NET Core 邮件发送库推荐

Semantic Kernel:图识文

C#13：params和正则源生成器

提升ASP.NET Core应用性能：使用YARP反向代理的最佳实践

Semantic Kernel:用Embedding做客服（RAG）

GraphRAG：知识图普RAG

【Smart Fill】自家AI智能辅助录入工具

Semantic Kernel:Chat聊天服务

推荐几款C#生成QR的库

Semantic Kernel:Service内置服务

Asp.Net Core Identity API endpoints

扩展NLog加密日志

Semantic Kernel：Kernel内核

HybridCache 混合缓存

Semantic Kernel概览

让.NET9中的OpenAPI有脸面

.NET9 中不一样的OpenAPI

一篇文章带你全面解析Linq架构

Smart Component 为你的.NET应用赋予AI能力

让传统应用开发融合AI能力

Microsoft AI Day in Begijing

我的生成式AI应用——智能输入(SmartFill)

SemanticKernel之LLama3案例

自动化构建三剑客：msbuild、cake和nuke

发掘几款亮眼的C#压缩库，帮你轻松优化数据处理

介绍几款C#定时任务处理库，让您任务管理更轻松

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉