今日开源(2024-09-30):中国电信开源TeleChat2星辰语义大模型,中英文高质量语料训练,完全基于国产算力

文摘   2024-09-30 19:09   北京  


🏆 基座模型

①项目:Telechat2

星辰语义大模型TeleChat2是由中国电信人工智能研究院研发训练的大语言模型,该系列模型完全基于国产算力训练。本次开源TeleChat2-115B模型采用10万亿 Tokens中英文高质量语料进行训练,同步开源对话模型TeleChat2-115B的多格式、多平台权重文件。TeleChat2在训练数据、训练方法等方面进行了改进,在通用问答和知识类、代码类、数学类榜单上相比TeleChat1均有大幅提升。


②项目:CogView3

CogView3是一种新颖的文本到图像生成系统,采用了中继扩散技术。该系统将高分辨率图像生成过程分解为多个阶段,通过中继超分辨率过程,在低分辨率生成结果中添加高斯噪声,并从这些噪声图像开始扩散过程。通过对扩散模型的渐进蒸馏,CogView3在保持相当输出质量的同时,将推理时间缩短至SDXL的1/10。


🛠️框架平台、必备工具

①项目:ChatMLX

ChatMLX 是一款现代化的开源高性能聊天应用,基于大型语言模型,依托于强大的MLX和 Apple silicon。它支持多种模型,为用户提供丰富多样的对话选项。该应用在本地运行 LLM,以确保用户隐私和安全。


②项目:Outspeed

Outspeed 是一个受 PyTorch 启发的 SDK,用于构建基于语音和视频输入的实时 AI 应用。提供低延迟的流式音频和视频处理、对 PyTorch 用户友好的直观 API、自定义 AI 模型的灵活集成、数据预处理和模型部署工具的功能。Outspeed 非常适合开发语音助手、视频分析和其他处理音频视觉数据的实时 AI 应用。


③项目:Llama assistant

Llama assistant是基于Llama 3.2的AI助手,旨在帮助您处理日常任务。能够识别您的声音,处理自然语言,并根据您的指令执行各种操作,如文本摘要、句子重述、回答问题、撰写电子邮件等该助手可以在本地计算机上离线运行,尊重您的隐私,不会将任何数据发送到外部服务器。


④项目:MemoryScope

MemoryScope可以为LLM聊天机器人提供强大且灵活的长期记忆能力,并提供了构建长期记忆能力的框架。MemoryScope可以用于个人助理、情感陪伴等记忆场景,通过长期记忆能力来不断学习,记得用户的基础信息以及各种习惯和喜好,使得用户在使用LLM时逐渐感受到一种“默契”。


👋网页端访问:https://sota.jiqizhixin.com

欢迎扫码加入社群
交流LLM推理与微调、Agent/RAG应用构建开发经验


机器之心SOTA模型
追踪 AI 开源进展,探索先进开发实践。
 最新文章