WEEKLY REPORT
11/03
2024
AIGC本周资讯
互联网行业一周新闻速览
01
WEEKLY NEWS
科学实验室走向全自动化,机器人融合AI,加速科学发现,Science子刊观点
北卡罗来纳大学教堂山分校的研究人员在《Science Robotics》杂志上发表了一篇题为「Transforming science labs into automated factories of discovery」的 Viewpoint 文章。
研究人员定义了五个实验室自动化级别,从辅助自动化到全自动化。还介绍了在提高自动化水平和增加实验室内任务的通用性时出现的机器人研究挑战。
论文链接:https://www.science.org/doi/10.1126/scirobotics.adm6991
研究人员定义了五个实验室自动化级别,从简单的实验室辅助到完全自动化。来说明自动化如何在科学实验室中发展:
辅助自动化 (A1):在此级别,单个任务(例如液体处理)是自动化的,而人类则负责大部分工作。
部分自动化 (A2):机器人执行多个连续步骤,由人类负责设置和监督。
条件自动化 (A3):机器人管理整个实验过程,但当出现意外事件时需要人工干预。
高度自动化 (A4):机器人独立执行实验,自动设置设备并应对异常情况。
完全自动化 (A5):在此最后阶段,机器人和人工智能系统完全自主运行,包括自我维护和安全管理。
研究人员定义的自动化级别可用于评估该领域的进展,帮助建立适当的安全协议,并为科学领域和机器人技术的未来研究设定目标。尽管如今较低水平的自动化很常见,但实现高度和完全自动化是一项研究挑战,它需要机器人能够在不同的实验室环境中运行、处理复杂的任务,并与人类和其他自动化系统无缝交互。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-28-7
02
WEEKLY NEWS
先让不懂代码的来测?通义这个新产品,代码刚写完,预览就出来了
10 月 24 日,阿里旗下的通义正式宣布了「代码模式」,并开放试用预约,首批邀请 1024 名用户进行体验。
通义代码模式旨在降低应用开发的门槛。它针对简单的代码和应用生成需求,主打一个所见即所得。
具体来说,人与 AI 大模型的交流现在会出现在一个专门的窗口里,AI 大模型生成的代码会实时地在网页上跑出来以供预览。
这是国内首家实现「让使用者一句话编程,并实时生成可见预览」的公司,通义代码模式的出现,或许代表着一种未来新趋势。
言听计从,不用吵架
24 小时随时等需求的「贴身程序员」来了
原文链接:
https://www.jiqizhixin.com/articles/2024-10-28-6
03
WEEKLY NEWS
整合长期记忆,AI实现自我进化,探索大模型这一可能性
天桥脑科学研究院和普林斯顿大学等多所研究机构发布了一篇研究论文,详细阐述了长期记忆对 AI 自我进化的重要性,并且他们还提出了自己的实现框架 —— 基于多智能体的 Omne,其在 GAIA 基准上取得了第一名的成绩。
论文标题:Long Term Memory : The Foundation of AI Self-Evolution
论文地址:https://arxiv.org/pdf/2410.15665
首先,该团队将 LLM 的模型进化过程分成了三个主要阶段
阶段 1:在物理世界中积累认知。
阶段 2:在数字世界中构建基础模型。
阶段 3:模型自我进化,以实现更强大的智能。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-22-5
04
WEEKLY NEWS
一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源
仅需1块80G显卡,大模型理解小时级超长视频。
智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校带来最新成果超长视频理解大模型Video-XL。
它借助语言模型(LLM)的原生能力对长视觉序列进行压缩,不仅保留了短视频理解的能力,而且在长视频理解上展现了出色的泛化能力。
相较于同等参数规模的模型,Video-XL在多个主流长视频理解基准评测的多项任务中排名第一。
而且在效率与性能之间实现了良好的平衡,仅需一块80G显存的显卡即可处理2048帧输入(对小时级长度视频采样),并在视频“海中捞针”任务中取得了接近95%的准确率。
原文链接:
https://www.qbitai.com/2024/10/212588.html
05
WEEKLY NEWS
神秘模型“小熊猫”一夜刷屏:排名超Flux、Midjourney
一夜之间,名为“red_panda” (小熊猫)的神秘文生图模型狠狠火了!!
登顶文生图竞技场,直接将Flux、Midjourney等一众顶尖模型踩在脚下——
其ELO得分比Flux 1.1 Pro高出100多,胜率高达79%,每7秒就能生成一张图像。生成效果be like:
原文链接:
https://www.qbitai.com/2024/10/212864.html
06
WEEKLY NEWS
Cyan青心意创震撼发布“全面拟人”机器人OrcaⅠ,机器人开始懂情感、有温度
0月30日,Cyan青心意创(原“青心创新/萨恩异创”)正式发布了独立自研的通用人形机器人OrcaⅠ的动态视频,展示了其在“拟人直膝”状态下的行走、爬坡、原地转圈、行走/站立状态下的步态恢复、户外路面行走等运动控制能力,大语言模型加持下兼具情绪表达的自然语言交互能力,以及在保证精准控制状态下丝滑流畅的双臂操作能力。
相较于市面上常见的“机械感”过重的机器人设计,OrcaⅠ摆脱了传统观念中人们对于“机器人”的固有印象,在本体设计、运动控制、自然语言对话、双臂操作等多个维度实现技术突破,并最终赋予其更为灵动自然的运动表现、更为逼真的人机交互、更为精准平滑的双臂操作,全栈技术领域处于行业顶尖水平。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-30-11
07
WEEKLY NEWS
突破短视频局限!MMBench 团队构建中长视频开放问答评测基准,全面评估多模态大模型视频理解能力
在最新的NeurIPS D&B 2024中由浙江大学联合上海人工智能实验室,上海交通大学和香港中文大学提出的MMBench-Video打造了一个全面的开放性视频理解评测基准,并针对当前主流MLLM构建了开源的视频理解能力评估榜单。
与其他数据集相比,MMBench-Video具有如下几个突出特点:
视频时长跨度较广,镜头数多变:采集的视频时长从30秒到6分钟不等,避免了过短视频语意信息简单,过长视频评测带来的资源消耗大等问题。同时视频涵盖的镜头数整体呈长尾分布,一个视频最多具有210个镜头,包含了丰富的场景与语境信息。
原文链接:
https://www.qbitai.com/2024/10/213657.html
08
WEEKLY NEWS
ChatGPT正式成为AI搜索,免费可用
ChatGPT 正式成为一款 AI 搜索引擎了!
北京时间 11 月 1 日凌晨,在 ChatGPT 两岁生日之际,OpenAI 宣布为 ChatGPT 推出了最新的人工智能搜索体验。
ChatGPT search 的推出正式宣告 ChatGPT 消除了即时信息这一最后短板。现在,人们与全球最先进 AI 大模型聊天时,也可以通过网络资源链接快速、及时地获取答案了。
即日起,付费订阅者(以及 SearchGPT 候补名单上的用户)将获得可联网的实时对话信息能力,免费用户、企业用户和教育用户也将在未来几周内陆续获得访问权限。
原文链接:
https://www.jiqizhixin.com/articles/2024-11-01-5
09
WEEKLY NEWS
锚定行业痛点,讯飞星火深度赋能民生刚需
2024年被称为“大模型应用元年”,人工智能应用日益进入到场景化的深水区。10月24日,第七届世界声博会暨2024科大讯飞全球1024开发者节开幕式上,科大讯飞正式发布星火4.0 Turbo,根据真实数据背靠背的测试,星火4.0 Turbo的7大能力超过GPT-4 Turbo,代码能力和数学能力超越GPT-4o。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-31-15
下期精彩继续