太强了，8 行代码，开发一个AI应用

科技 2025-01-16 11:00 中国香港

大家好，我是章北海

发现一个超强的Python库，创建大模型应用不能更简单

8行代码足以（有2行非必须）

import gradio as gr
import ai_gradio

gr.load(
    name='qwen:qwen1.5-14b-chat', 
    src=ai_gradio.registry,
    title='AI Chat',
    description='Chat with an AI model'
).launch()

它还有语音聊天、视频聊天、相机模式、浏览器自动化等功能，功能强悍、使用极其简单。

项目地址：https://github.com/AK391/ai-gradio

❝
ai-gradio 是一个 Python 包，可帮助开发者轻松创建由各种 AI 提供商支持的机器学习应用。它基于 Gradio 构建，为多个 AI 模型和服务提供统一接口。。

重要亮点

功能丰富：ai-gradio 提供多提供商支持，集成了 15 个以上的 AI 提供商，包括 OpenAI、Google Gemini、Anthropic 等。具有文本聊天、语音聊天、视频聊天、代码生成、多模态、代理团队、浏览器自动化等功能。
安装便捷：可以通过 pip 安装 ai-gradio 的核心包和特定提供商支持的包。有多种安装选项，如安装单个提供商支持、安装所有提供商等。
使用示例多样：提供了 API 密钥配置方法、快速入门示例和高级功能示例。包括创建不同类型的聊天界面、编码助手、多提供商界面、CrewAI 团队、浏览器自动化和 Swarms 集成等。

Core Language Models

Provider	Models
OpenAI	gpt-4-turbo, gpt-4, gpt-3.5-turbo
Anthropic	claude-3-opus, claude-3-sonnet, claude-3-haiku
Gemini	gemini-pro, gemini-pro-vision, gemini-2.0-flash-exp
Groq	llama-3.2-70b-chat, mixtral-8x7b-chat

Specialized Models

Provider	Type	Models
LumaAI	Generation	dream-machine, photon-1
DeepSeek	Multi-purpose	deepseek-chat, deepseek-coder, deepseek-vision
CrewAI	Agent Teams	Support Team, Article Team
Qwen	Language	qwen-turbo, qwen-plus, qwen-max
Browser	Automation	browser-use-agent

安装与使用

安装很简单，pip install ai-gradio是必须的，还需要安装额外的大模型支持包，比如我只安装了pip install 'ai-gradio[deepseek]' 和 pip install 'ai-gradio[qwen]'，想省点事也可以一把梭哈pip install 'ai-gradio[all]'

# Install core package
pip install ai-gradio

# Install with specific provider support
pip install 'ai-gradio[openai]'     # OpenAI support
pip install 'ai-gradio[gemini]'     # Google Gemini support
pip install 'ai-gradio[anthropic]'  # Anthropic Claude support
pip install 'ai-gradio[groq]'       # Groq support
pip install 'ai-gradio[crewai]'     # CrewAI support
pip install 'ai-gradio[lumaai]'     # LumaAI support
pip install 'ai-gradio[xai]'        # XAI/Grok support
pip install 'ai-gradio[cohere]'     # Cohere support
pip install 'ai-gradio[sambanova]'  # SambaNova support
pip install 'ai-gradio[hyperbolic]' # Hyperbolic support
pip install 'ai-gradio[deepseek]'   # DeepSeek support
pip install 'ai-gradio[smolagents]' # SmolagentsAI support
pip install 'ai-gradio[fireworks]'  # Fireworks support
pip install 'ai-gradio[together]'   # Together support
pip install 'ai-gradio[qwen]'       # Qwen support
pip install 'ai-gradio[browser]'    # Browser support
# Install all providers
pip install 'ai-gradio[all]'

简单拿通义千问举个例

模型列表：https://bailian.console.aliyun.com/?spm=a2c4g.11186623.0.0.6f94b0a8AKJSUG#/model-market

API获取：https://bailian.console.aliyun.com/#/home

在控制台的右上角选择 API-KEY，然后创建一个，用于通过API调用大模型。

copy 后备用

题外话，下面是通义千问api调用示例，用Python使用Qwen很方便

import os
from openai import OpenAI

client = OpenAI(
    # 若没有配置环境变量，请用百炼API Key将下行替换为：api_key="sk-xxx",
    api_key=os.getenv("DASHSCOPE_API_KEY"), # 如何获取API Key：https://help.aliyun.com/zh/model-studio/developer-reference/get-api-key
    base_url="https://dashscope.aliyuncs.com/compatible-mode/v1",
)

completion = client.chat.completions.create(
    model="qwen-plus", # 模型列表：https://help.aliyun.com/zh/model-studio/getting-started/models
    messages=[
        {'role': 'system', 'content': 'You are a helpful assistant.'},
        {'role': 'user', 'content': '你是谁？'}
        ]
)
print(completion.choices[0].message.content)

就ai-gradio例子，需要提前设置好api key

import os

os.environ["DASHSCOPE_API_KEY"] = "sk-上面复制好的"

其实ai-gradio还有窗口模式，同上，仅需提前备好api，就可以一个页面切换文本、图像、代码三模式使用。

import gradio as gr
import ai_gradio

with gr.Blocks() as demo:
    with gr.Tab("Text"):
        gr.load('openai:gpt-4-turbo', src=ai_gradio.registry)
    with gr.Tab("Vision"):
        gr.load('deepseek:deepseek-vision', src=ai_gradio.registry)
    with gr.Tab("Code"):
        gr.load('deepseek:deepseek-coder', src=ai_gradio.registry)

demo.launch()

语音输入和相机模式我没有深入玩

简单试了一下

gr.load(
    name='openai:gpt-4-turbo',
    src=ai_gradio.registry,
    enable_voice=True,
    title='AI Voice Assistant'
).launch()

报错如下

HTTP Error Your request was:

POST /Accounts/None/Tokens.json

Twilio returned the following information:

Unable to create record: Authentication Error - No credentials provided

More information may be available here:

https://www.twilio.com/docs/errors/20003

找了原因，camera和voice都依赖browser-use

项目地址：

https://github.com/browser-use/browser-use

我看官方示例，感觉蛮强的，有机会再试

import asyncio
import os

from langchain_ollama import ChatOllama

from browser_use import Agent


async def run_search():
 agent = Agent(
  task=(
   '1. Go to https://www.reddit.com/r/LocalLLaMA'
   "2. Search for 'browser use' in the search bar"
   '3. Click search'
   '4. Call done'
  ),
  llm=ChatOllama(
   # model='qwen2.5:32b-instruct-q4_K_M',
   # model='qwen2.5:14b',
   model='qwen2.5:latest',
   num_ctx=128000,
  ),
  max_actions_per_step=1,
  tool_call_in_content=False,
 )

 await agent.run()


if __name__ == '__main__':
 asyncio.run(run_search())

机器学习算法与Python实战

长期跟踪关注统计学、数据挖掘、机器学习算法、深度学习、人工智能技术与行业发展动态，分享Python、机器学习等技术文章。回复机器学习有惊喜资料。

最新文章

奥特曼被逼急：深夜上线 o3-mini，甚至免费，网友：还是选DeepSeek

DeepSeek突围奥秘曝光，天才集结，开出千万年薪

微软前脚调查DeepSeek，后脚火速上线

DeepSeek 更值得被关注的是R1-Zero，强化学习（RL）比人类专家标注的监督微调（SFT）更靠谱

阿里除夕发布Qwen2.5-Max反超DeepSeek V3，一句话开发小游戏

DeepSeek引发硅谷恐慌：它正向西方AI巨头发起挑战

「神秘的东方力量」刷爆美国AI圈，李彦宏啪啪打脸

英伟达RTX 5090评测解禁，AI 能力太强了

2025泰晤士世界学科排名公布！北大第一、浙大第二

央国企！入局AI大模型（附66家名单）

吴恩达：中国的DeepSeek让人印象深刻，我想对他们说“加油”

超级AI应用

狂发顶会的特征融合，再出神作！

“CloseAI”在美国，“OpenAI”在中国

请立即拿下软考证（政策风口）

大模型参加考研，第一名是 OpenAI 的 GPT-o1模型，第二名是是国产！

突发！电子科技大学被军方通报处罚

英伟达特供中国的5090D，被爆只能玩游戏，不能玩AI！！！

【民间】2024毕业生薪酬排行榜发布！还是清华最强

搭建完美的写作环境：Obsidian + Cloudflare R2 同步笔记

太强了，8 行代码，开发一个AI应用

CNN+LSTM+Attention多热点搭配！又是创新性拉满的高分思路！！

老婆饼里没有老婆，夫妻肺片里没有夫妻，RLHF 里也没有真正的 RL

AI服务器环境搭建指南，从裸机到“战斗”机（下集）

2024年AI大模型回顾！

AI又双叒叕来革命，程序员又双叒叕失业潮

AI服务器环境搭建指南，从裸机到“战斗”机（2）：防火墙、Git、Docker、Python、多用户JupyterHub

突发！美国拟（全面禁止）向中国出口 AI 芯片

AI服务器环境搭建指南，从裸机到“战斗”机（上集）

【附复现代码】基于PINN的论文创新思路

血亏，刚买了4090，更强悍、更便宜的5090来了

【机器学习数学基础系列】概率论中的极大似然估计：入门与Python实践

统计学中的假设检验：Python实现U检验和卡方检验

用大模型写了本书

本地运行大模型，要买什么显卡？

Python中级教程-测试开发

抑郁6个月后，DeepMind科学家离世，万字绝笔谈在AI行业工作压力

Python高级编程：web开发之Flask

Python 高级教程：异步与并发编程详解

真的建议赶紧搞个软考证书！（红利期）

ICML 2025，即将截稿！

Dify 零代码 AI 应用开发：内网离线部署指南

2025年了，居然还有人 Python 都没入门

2024年过去了，我很不怀念它

Docker 极简入门

2024年最常用的Python库和工具

OpenAI裂变成了两块：一块营利，一块非营利

国产大模型，火爆全球，6710亿参数，已开源！

横扫2024各大顶会，用Mamba发Paper真的很轻松！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉