1.阿里云发布Qwen2.5-Turbo大语言模型,支持100万Token上下文长度,能处理10部《三体》量级文本。模型在长文本理解能力上超越GPT-4,推理速度提升4.3倍,处理成本大幅降低。
2.微信公众号推出AI音色克隆功能,目前尚未全量上线。这一新功能为用户提供了个性化的阅读体验,允许他们通过自己的声音朗读文章,增强了内容的情感表达。
3.北京大学科研团队发布多模态开源模型LLaVA-o1,具备自发、系统推理的视觉语言能力,性能超越GPT-o1。LLaVA-o1的代码和预训练权重将全面开源。
4.Fireworks AI推出了复合式AI模型f1,其复合推理架构整合多个开源模型优势,通过简洁提示界面提供强大功能支持。
5.爱诗科技宣布旗下视频生成平台 PixVerse 文生视频、图生视频技术服务全球开放,旨在推动AI视频大模型的多元化应用发展。
6.ElevenLabs推出新功能,允许用户在其开发者平台上定制对话式AI智能体,包括语音语调、回复长度等变量。用户可添加知识库,集成自定义大型语言模型。