快手发布新 AI 产品「飞船」,能起飞吗?

科技   2024-08-16 09:01   上海  


🌐 Gemini Live : 谷歌 AI 语音助手革新

🌏 Genie :AI 编程工具的革命性突破

🎶 Melodio : 全球首个 AI 流媒体音乐 App

🚀 快手推出 AI 对话助手 App「飞船」

🤝 梅赛德斯-奔驰中国与火山引擎战略合作

💰 Cosine 获 250 万美元种子轮融资

📈 UptimeAI 在 A 轮融资中筹集 1400 万美元

🤖 首位「AI 科学家」问世

Gemini Live: 谷歌 AI 语音助手革新

谷歌在激烈的 AI 竞赛中抢先一步,宣布推出 Gemini Live[1] 语音助手,准备在全球超 52 亿的安卓和 iOS 设备上掀起一场革命。尽管在演示中遇到了小插曲,但谷歌决心不等待,直面 OpenAI 与苹果的竞争。

Gemini Live 承诺提供更自然的对话体验,用户可以实时与 AI 头脑风暴,讨论职业选择等话题。谷歌展示了其 10 种不同的声音选项和免提功能,允许用户在应用程序后台或手机锁定时继续对话。谷歌的这一举措是对 OpenAI「Her」的直接挑战。尽管 OpenAI 的语音功能仍在测试阶段,谷歌已经以每月 19.99 美元的价格向安卓用户推出了 Gemini Live 英语版本,并计划在未来几周内推出 iOS 版本和更多语言支持。

谷歌同时发布了搭载最新 AI 处理器 Google Tensor G4 的 Pixel 9 系列手机,强调了其 AI 加持的拍照能力和图像处理算法。Google Tensor G4 芯片在性能上有了显著提升,为 AI 功能提供了强大支持。谷歌还推出了基于 Imagen 3 的 AI 生图应用 Pixel Studio,该应用能在 2 秒内生成图像,展示了谷歌在 AI 图像生成领域的最新进展。

Genie: AI 编程工具的革命性突破

Cosine 公司最新推出的 Genie 编程工具在 SWE-Bench 测试中以 30.08% 的高分领先,超越了 Devin 和 Swe-agent+GPT-4,被誉为全球最强大编程辅助工具。Genie 的训练方法独特,使用包含程序员推理过程的特殊数据集,并通过「自我改进机制」不断优化。初始训练后,开发人员利用 Genie 生成的合成数据进行后续训练,以模拟错误和复杂情况,实现持续改进。

Genie 的开发始于 2022 年,由 Cosine 公司创始人 Alistair Pullen 在伦敦大学首次展示原型。其目标是创建一款无需人工干预即可自动执行编码和优化的工具。Genie 提供全面的功能支持,包括功能开发、问题修复、代码重构等,支持 JavaScript、Python、Java 等多种主流编程语言,满足编程领域的广泛需求。

Melodio :  AI 流媒体音乐 App

国内公司昆仑万维推出了全球首个 AI 流媒体音乐平台「Melodio」,Melodio 的使用非常简洁,用户只需输入音乐的 Prompt 并点击播放,即可享受 AI 生成的音乐。它支持多种语言,包括中文,并能生成不同风格的歌曲以适应不同的场景和心情。Melodio 不仅能够生成单曲,还能根据用户的需求生成多首歌曲,且在风格和氛围上保持一致性,适合长时间收听。

昆仑万维还推出了「Mureka」,这是一个 AI 音乐创作平台,用户可以输入歌名和歌词,选择参考音乐,然后由 AI 生成完整的音乐作品。昆仑万维采用了音乐领域中的类 Sora 架构,包括 Large-scale Transformer 和 Diffusion Transformer 两个模块,分别负责谱曲和演唱部分,确保生成的音乐具有高质量和自然度。Mureka 在人声维持、音质、自然度和发音可懂度上达到了行业领先水平,并且在音乐性指标上也有显著提升。

快手推出 AI 对话助手 App飞船

快手最近推出了一款名为「飞船」[2]的 AI 智能对话助手应用程序。

在飞船平台上,用户扮演「船长」角色,由名为「快快」的虚拟少女领航员引导体验。用户可以与默认的 AI 助手「领航员」进行互动对话,获取信息和知识。App 配备了语音交互功能,增强了用户的交互体验。App 支持用户创建和定制专属的 AI 虚拟角色,这些角色可以用于内容创作和知识解答。

快手曾在 2021 年推出过「飞船」的早期版本,当时它是一款类似于「ClubHouse」的语音聊天产品。「飞船」App 基于快手自研的大型语言模型「快意」,专注于提供 AI 虚拟陪伴。

奔驰中国与火山引擎战略合作

梅赛德斯-奔驰中国与北京火山引擎科技有限公司宣布签署战略合作备忘录,合作将聚焦于大模型、生成式人工智能和大数据等领域。

基于双方最新签署的合作备忘录,梅赛德斯-奔驰中国与火山引擎未来将继续扩大合作,构建车场景插件和工具链,为用户带来更智能、便捷、个性化的体验。火山引擎将支持梅赛德斯-奔驰中国研发团队高效地生成各类智能应用。

Cosine 获 250 万美元种子轮融资

Cosine,一家专注于模仿人类推理的人工智能初创公司,近期完成了 250 万美元的种子轮融资。融资领投方为 Uphonest Capital 和 SOMA Capital,跟投方包括 Lakestar 和 Focal 等。

Cosine 致力于成为「世界上最像人类的 AI 」,通过其 AI 程序员 Genie 实现这一目标。Cosine 通过对人类推理的编码化和训练,使 Cosine 的 AI 程序员「Genie」在推理方面「异常人性化」。Genie 在 SWE-Bench 测试中以 30.08% 的评分击败了 Devin 和 Swe-agent+GPT-4,分别以 13.8% 和 12.47% 的评分位列其后。目前,Cosine 已经开放了 Genie 的 申请试用,让更多开发者和企业能够体验这一先进技术。

UptimeAI A 轮融资 1400 万美元

UptimeAI 专注于通过 AI 提高运营效率,在 A 轮融资中成功筹集了 1400 万美元。领投方为 WestBridge Capital,跟投方包括 Emergent Ventures 和 Aditya Birla Ventures。

UptimeAI 由 Jagadish Gattu 和 Vamsi Yalamanchili 在 2019 年创立,是一家通过其 AI Expert OEx 平台提供运营能力的技术提供商。UptimeAI 的平台利用人工智能帮助企业分析资产绩效与流程异常之间的关系,从而优化运营效率。该公司的解决方案已被全球多个工业客户采用,尤其在北美、中东和印度等地区。

首位「AI 科学家」问世

Sakana AI 公司,由参与开发 Transformer 模型的 Llion Jones 创立,推出了首个自动化科学研究和开放式发现的综合 AI 系统——「The AI Scientist」能够独立完成从研究想法的提出到论文撰写的全过程,并且已经生成了 10 篇学术论文。

「AI 科学家」在不同的研究领域生成了多篇论文,例如扩散模型、语言模型、Transformer 与强化学习结合等方向,论文包括创新性方法提出、实验结果分析,并在某些情况下提供了代码开源。系统由想法生成、实验迭代、论文写作和自动化同行评审四部分组成。在实验中,比较了不同大模型的效果,发现 Claude-Sonnet-3.5 在多个方面表现最佳。

人生真谛的要旨之一,乃是告诫我们不要只是忙忙碌碌,以致忽视了生活的可叹可敬之处。

——亚历山大·辛德勒

编辑团队

编辑:Yuki

设计:Ivan

商务合作请加微信:Rwkfbcianvd

参考资料

[1]

Gemini Live: https://blog.google/products/gemini/made-by-google-gemini-ai-updates/

[2]

「飞船」: https://www.spaceshipapp.cn/#/?utm_source=ai-bot.cn


十字路口Crossing
AI 正在给各行各业带来改变,我们在「十字路口」关注变革与机会,寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱,新变化,新的可能性。「十字路口」是乔布斯形容苹果公司站在科技与人文的十字路口,伟大的产品往往诞生在这里。
 最新文章