FastChat：打造你自己的聊天机器人

文摘 2024-11-09 08:02 上海

大家好！我是风哥，一个专注AI领域的Python工程师。今天给大家介绍一个超级强大的开源聊天机器人框架 —— FastChat！它能让你轻松部署自己的AI助手，快来一起学习吧！

基础安装与配置

首先，安装FastChat：

1pip install fschat

如果想要完整功能，建议这样安装：

1pip install "fschat[model_worker,webui]"

快速启动服务

FastChat提供了三个主要组件，需要分别启动：

1# 1. 控制器
2python -m fastchat.serve.controller
3
4# 2. 模型Worker
5python -m fastchat.serve.model_worker --model-path lmsys/vicuna-7b-v1.5
6
7# 3. Web界面
8python -m fastchat.serve.gradio_web_server

核心功能实现

1. 基础对话实现

 1from fastchat.model import load_model, get_conversation_template
 2
 3# 加载模型
 4model, tokenizer = load_model("lmsys/vicuna-7b-v1.5")
 5
 6# 创建对话模板
 7conv = get_conversation_template("vicuna")
 8conv.append_message(conv.roles[0], "你好！")
 9conv.append_message(conv.roles[1], None)
10
11# 生成回复
12prompt = conv.get_prompt()
13output = model.generate(prompt, max_length=2048)
14response = tokenizer.decode(output)
15print(response)

2. 自定义对话设置

 1from fastchat.serve.inference import ChatIO, chat_loop
 2
 3class CustomChatIO(ChatIO):
 4    def prompt_for_input(self, role) -> str:
 5        return input(f"{role}: ")
 6
 7    def prompt_for_output(self, role: str):
 8        print(f"{role}: ", end="", flush=True)
 9
10    def stream_output(self, output_text: str):
11        print(output_text, end="", flush=True)
12
13# 启动对话循环
14chat_loop(
15    model_path="lmsys/vicuna-7b-v1.5",
16    temperature=0.7,
17    max_new_tokens=512,
18    chatio=CustomChatIO(),
19)

高级特性

1. 多轮对话管理

 1from fastchat.conversation import Conversation
 2
 3def create_chat_session():
 4    conv = Conversation(
 5        system="你是一个友好的AI助手。",
 6        roles=("用户", "助手"),
 7        messages=[],
 8        offset=0,
 9        sep_style=SeparatorStyle.TWO,
10    )
11
12    # 添加对话历史
13    conv.append_message("用户", "今天天气真好！")
14    conv.append_message("助手", "是的，春暖花开的季节最适合出门走走。")
15
16    return conv

2. 参数调优

 1def generate_response(prompt, model, tokenizer, **kwargs):
 2    # 自定义生成参数
 3    generation_config = {
 4        "temperature": 0.7,  # 温度值，控制随机性
 5        "top_p": 0.9,       # 核采样阈值
 6        "top_k": 40,        # 保留概率最高的k个token
 7        "num_beams": 4,     # beam search的束宽
 8        "max_new_tokens": 512,  # 最大生成长度
 9        "repetition_penalty": 1.1,  # 重复惩罚项
10    }
11
12    # 更新自定义参数
13    generation_config.update(kwargs)
14
15    # 生成回复
16    output_ids = model.generate(
17        tokenizer(prompt, return_tensors="pt").input_ids,
18        **generation_config
19    )
20
21    return tokenizer.decode(output_ids[0])

3. 流式输出实现

 1import time
 2
 3class StreamingChatIO(ChatIO):
 4    def stream_output(self, output_text: str):
 5        for char in output_text:
 6            print(char, end="", flush=True)
 7            time.sleep(0.02)  # 模拟打字效果
 8        print()
 9
10# 使用流式输出
11chat_loop(
12    model_path="lmsys/vicuna-7b-v1.5",
13    chatio=StreamingChatIO(),
14)

4. 自定义模型加载

 1def load_custom_model():
 2    # 自定义模型配置
 3    model_config = {
 4        "model_path": "your_model_path",
 5        "device": "cuda",  # 或 "cpu"
 6        "num_gpus": 1,
 7        "max_gpu_memory": "15GiB",
 8        "load_8bit": False,  # 8位量化
 9        "cpu_offloading": False,
10    }
11
12    # 加载模型
13    model = load_model(
14        model_config["model_path"],
15        device=model_config["device"],
16        num_gpus=model_config["num_gpus"],
17        max_gpu_memory=model_config["max_gpu_memory"],
18        load_8bit=model_config["load_8bit"],
19    )
20
21    return model

实用技巧

1. 异常处理

1def safe_chat_response(prompt, model, tokenizer):
2    try:
3        response = generate_response(prompt, model, tokenizer)
4        return response
5    except Exception as e:
6        print(f"生成回复时出错: {str(e)}")
7        return "抱歉，我现在无法正常回答，请稍后再试。"

2. 对话历史保存

 1import json
 2
 3def save_conversation(conv, filename):
 4    history = {
 5        "messages": conv.messages,
 6        "system": conv.system,
 7        "roles": conv.roles,
 8    }
 9
10    with open(filename, 'w', encoding='utf-8') as f:
11        json.dump(history, f, ensure_ascii=False, indent=2)
12
13def load_conversation(filename):
14    with open(filename, 'r', encoding='utf-8') as f:
15        history = json.load(f)
16
17    conv = Conversation(
18        system=history["system"],
19        roles=history["roles"],
20        messages=history["messages"],
21    )
22    return conv

今天的Python AI开发分享就到这里啦！FastChat是个功能强大的框架，还有很多有趣的特性等待大家探索。有问题随时在评论区问我，记得点赞收藏，下次给大家带来更多AI开发技巧！

http://mp.weixin.qq.com/s?__biz=MzkzNjg1Njk2Ng==&mid=2247483856&idx=1&sn=8653e431b643f0273f60eb6501733bb5

py学习基地ai

分享生活百态，情感故事，了解不一样的人生

上海，一女子再婚不到1年，为了取悦新丈夫，要求同住的87岁老母亲搬走。母亲提出给房租，女子依旧不肯，竟将老母亲告上法庭，法院判了

江苏，一男子贷款38万给女方彩礼，结婚三天后坦白：贷款我们慢慢还。女子怒起诉离婚，男子：离婚可以，38万彩礼必须归还！法院判了

太离谱了！重庆女老板花300万逼已婚男员工离婚，同居一年后分手不甘心，竟状告原配想要回300万，原配提供一份关键证据，法院判了！

江苏，已婚男子迷恋网络女主播，打赏22万元，并线下发生关系，妻子发现后，要求归还，女主播：是你老公自愿打赏的。法院判决令人意外

江西，一女子在路边捡到金手镯，回家后发现手镯掉色，以为是假的扔掉了，失主找到女子索赔1.6万：我有金店发票。法院判了

广州，一女子独自赡养母亲20余年，母亲去世后，留下价值500万房产，哥哥：妹妹财产我们平分。女子拒绝后被哥哥告上法庭。法院判了！

太不要脸了！湖北男子患癌症担心日子难过，放弃治疗，妻子料理完后事，发现丈夫银行卡300万被婆婆取走。婆婆：我有遗嘱。法院判了！

太炸裂了！四川，男子癌症住院，发现妻子有外遇，立下遗嘱将1000万遗产都留给了弟弟，妻子：我有权得到遗产，法院判了！

太离谱了！广州，一男子意外身亡，给妻子和儿子留下560万遗产，去世一年后，情妇借冻胎生娃，过来争夺遗产。法院判决令人意外

湖南，男子与妻子假离婚，将1300万财产给妻子，自己只有130万。男子收回800万欠款后，妻子要求复婚，男子拒绝，妻子告上法庭

江苏，男子租10辆奔驰当婚车，接完新娘下楼婚车不见了，无奈叫网约车接亲！婚后怒告租车行索赔2万，法院判了！

太不要脸了！上海，90岁阿婆把70万养老钱给儿子保管，生病住院时让儿子拿钱出来救命，儿子：根本就没给我钱。法院判了！

太离谱了！北京，男子捡到一枚钻戒，以为是假的就送给了女友，几天后被失主找上门，要求赔偿4.6万，法院判决令人意外

陕西，女子在出租屋偷会情夫，被老公逮个正着，女子跳楼摔成10级伤残，出院后把老公告上法庭，索赔40万，法院判了！

太离谱了！江西，一对情侣同居生活5年，分手后，男人要求女方返还“彩礼”100万元，女方：你真不要脸。男方怒吿上法庭，法院判了！

湖南，一位80岁老大爷去墓园祭拜老伴，被告知需续交20年费用，老大爷：我早就交清了啊？管理员：不交就挪走骨灰！

Python自动化办公必学！一个pandas库搞定所有Excel数据处理！

湖南，男子与妻子假离婚，将1300万财产给妻子，自己只有130万。男子收回800万欠款后，妻子要求复婚，男子拒绝，妻子告上法庭

Python自动化办公神器：10分钟学会用python-docx，让Word文档处理效率翻倍！

Python Matplotlib：数据可视化的艺术，绘制炫酷的可视化图形

Prettytable —— 一个Python中非常有用的表格输出库

FastChat：打造你自己的聊天机器人

PyInstaller —— 一个Python中非常有用的库，打包神器

Python爬虫数据写入Excel的三种方法，值得收藏

PyTorch，一个动态神经网络超人的Python库！

TensorFlow，一个机器学习框架之王的Python库！

PyPDF4，一个 PDF 处理利器的 Python 库！

Typer，一个现代化CLI应用创建的Python库！

Pytz，一个时区处理大师的 Python 库！

PyAutoGUI，零基础入门GUI自动化！

Python代码质量优化利器：Pylint实战指南

Paramiko：一个超实用的Python SSH库！

Rich，一个终端美化神器的Python库！特别好用

PyPDF2，一个PDF文件处理的Python库！超级好用

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉