周中报:全球首个“AI 程序员”Devin全面开放|谷歌Gemini2发布,全面狙击o1模型|苹果智能正式集成ChatGPT

科技   2024-12-12 21:01   广东  

SmartFlowAI


点击上方蓝字关注我们

全文约 1500 字,预计阅读时间 4 分钟

新闻资讯

  1. 全球首个“AI 程序员”Devin 全面开放:可独立开发 / 修复 bug,月费 500 美元

全球首个“AI 程序员”Devin 于 12 月 11 日全面开放。Cognition Labs 宣布,个人开发者和工程团队每月支付 500 美元即可获得完整访问权限,包括 Slack 集成、IDE 扩展及专业支持;大型企业可获定制解决方案。Devin 熟练掌握多种编程语言,能独立构建和部署网站及应用程序,自主发现并修复代码缺陷。它已通过多家 AI 公司的工程师面试,并在 Upwork 等平台完成实际项目。并可以采用沙盒计算环境,内置代码编辑器和浏览器,能快速学习新技术。与传统工具不同,它能理解复杂编程上下文并主动调整解决方案。


  1. 小米Vela系统代码开源,助力物联网设备灵活部署

小米于 12 月 11 日宣布 Vela 系统代码开源,OpenVela 项目已上线 GitHub 和 Gitee,采用 Apache 2.0 协议。是小米基于开源实时操作系统 NuttX 打造的物联网嵌入式软件平台,适配多种不同硬件规格的产品,最小系统仅需 8KB 内存,CPU 主频不限,适配任意 SoC 多核架构,支持柔性部署。


  1. Apple Intelligence整合ChatGPT:提升Siri协作、写作与摄影智能

Apple Intelligence对ChatGPT的深度整合主要体现在与Siri的协同工作、增强写作工具以及iPhone 16相机的视觉智能控制三个方面。这种整合允许Siri在需要时将任务移交给ChatGPT处理,同时用户可以利用ChatGPT进行文档的创建、细化和总结,以及更深入地了解拍摄对象。用户需通过设置启用相关功能,并可选择登录ChatGPT账号,系统还确保了用户对数据分享的完全控制权。


  1. Gemini2.0-谷歌推出的原生多模态输入输出 +Agent 为核心的AI模型

Gemini 2.0是谷歌新近推出的原生多模态输入输出AI模型。作为2.0家族的首款模型,Gemini 2.0 Flash以多模态输入输出和Agent技术为核心,其运行速度是1.5 Pro的两倍,且在关键性能指标上超越了1.5 Pro。该模型支持原生工具调用及实时音视频流输入,能提供文本、音频和图像的集成响应,并具备多语言音频输出的能力。Gemini 2.0旨在构建能够自主理解、规划和执行任务的智能助手。谷歌基于Gemini 2.0推出了Jules、Colab数据科学代理等原型,展示了其在编程、数据分析等领域的应用潜力。目前,Gemini 2.0 Flash及其API免费提供,可通过Google AI Studio和Vertex AI中的Gemini API使用,每分钟最多可处理15个提问,每天最多可处理1500个提问,计划于明年开放更多模型尺寸和功能。

https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/


小工具

1. 星流AI:一站式图像生成平台,赋能设计与影像创作

星流AI是LiblibAI打造的一站式AI图像生成平台,依托自研的Star-3通用图像生成模型,融合全球最大的LORA增强模型库及前沿的AI图像控制技术。它为设计师、摄影师及影像创作者提供强有力的支持,具备高精度图像生成、智能推荐、色彩控制、区域重绘、智能扩图及细节修复等多功能,广泛应用于电商、广告、艺术创作等领域,展现多样风格与卓越美学品质。


往期 · 推荐

🚀OpenAI 圣诞礼物第四弹:Canvas全量开放,上新两大功能💥

聊聊大模型推理系统之 Orca:大模型推理系统开山之作

OpenAI的强化微调:RL+Science 创造新神还是灭霸?

OpenAI的第一份礼:ChatGPT Pro和o1 Pro mode,但我们真的需要吗

🌠 番外:我们期待与读者共同探讨如何在 AI 的辅助下,更好地发挥人类的潜力,以及如何培养和维持那些 AI 难以取代的核心技能。通过深入分析和实践,我们可以更清晰地认识到 AI 的辅助作用,并在 AI 时代下找到人类的独特价值和发展空间。“机智流”公众号后台聊天框回复“cc”,加入机智流大模型交流群!

一起“点赞”三连👇

机智流
共赴 AI 时代浪潮~
 最新文章