WEEKLY REPORT
10/20
2024
AIGC本周资讯
互联网行业一周新闻速览
01
WEEKLY NEWS
首次!SpaceX完成「筷子夹火箭」式星舰回收,马斯克8年前设想成真
马斯克的 SpaceX 公司又完成一项壮举 —— 用发射架机械臂捕获回收了一枚试飞返航的助推火箭,实现了所谓的「筷子」夹火箭。
随着星舰第五次试飞的圆满结束,SpaceX 又达成了全新的「历史首次」,为超重型火箭「Super Heavy」能够成为像猎鹰 9 号运载火箭一样完全可重复使用的发射系统迈出了重要一步。在今年 6 月上一次试飞中,该助推器完成了类似的一系列动作,但最终坠落在了墨西哥湾。
回到此次的试飞,马斯克在试飞之前就表示非常有信心。此次试飞有两个主要目标:一是首次尝试在发射场「捕获」超重型助推器,二是星舰本体准确地在印度洋受控溅落。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-14-7
02
WEEKLY NEWS
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
伦敦大学学院(UCL)、上海交通大学、利物浦大学、香港科技大学(广州)、西湖大学联合开源了首个类 o1 全链条训练框架「OpenR」,一个开源代码库,帮助用户快速实现构建自己的复杂推断模型 。整个项目由 UCL 汪军教授发起和指导,实验主要由上海交大团队完成。
论文链接:https://github.com/openreasoner/openr/blob/main/reports/OpenR-Wang.pdf
代码链接:https://github.com/openreasoner/openr
教程链接:https://openreasoner.github.io/
原文链接:
https://www.jiqizhixin.com/articles/2024-10-14-5
03
WEEKLY NEWS
Evaluation is All You Need!首个开源多模态大模型通用评测器LLaVA-Critic
论文标题:LLaVA-Critic: Learning to Evaluate Multimodal Models
论文链接:https://arxiv.org/abs/2410.02712
项目主页:https://llava-vl.github.io/blog/2024-10-03-llava-critic/
数据与模型开源:https://huggingface.co/collections/lmms-lab/llava-critic-66fe3ef8c6e586d8435b4af8
该团队构建了一个涵盖了多样化评测场景和评分标准的评测指令遵循数据集(critic instruction-following dataset);之后,在这一数据集上训练 LLaVA-Critic,使之学会对模型回复给出合理评分(judgement)和打分依据(reason);更进一步,在多模态评测(LMM-as-a-Judge)和偏好学习(preference learning)两个场景中验证了 LLaVA-Critic 的有效性。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-14-3
04
WEEKLY NEWS
小滑块上个斜面,难倒多少高中生?现在,AI让它动起来了
随着人工智能的发展,我们已经看到各种知识学习新方法层出不穷,比如 AI 口语陪练就已成为一个颇受欢迎的应用。现在,卡尔加里大学和 Adobe 研究院的一项研究又展示了一个新可能:用 AI 将物理课本上的图表变成动画,直接演示物理机制的过程。如此一来,原本抽象的物理课程或许一下就会变得直观起来!
原文链接:
https://www.jiqizhixin.com/articles/2024-10-15
05
WEEKLY NEWS
自研多媒体处理框架BMF ,助力豆包视频生成模型突破业界难题
借助Intel的CPU等资源,火山引擎此次发布的大模型训练视频预处理方案依托于自研的多媒体处理框架BMF,能有效应对模型训练的算力成本挑战。此外,该方案还在算法和工程方面进行了调优,可以对海量视频数据高质量预处理,短时间内实现处理链路的高效协同,提高模型训练效率。值得一提的是,火山引擎本次还发布并开源了移动端后处理解决方案BMF lite版本。BMF lite支持端侧大模型接入和算子加速,更加轻量、通用。
原文链接:
http://www.qbitai.com/2024/10/207363.html
06
WEEKLY NEWS
Windows用户也能使用桌面版ChatGPT了,直接访问最强o1模型
目前,Windows 版 ChatGPT 可以在大多数 Windows 10 及更高系统上运行。与其他客户端相比仍存在一些限制,尚不支持语音,包括高级语音模式,并且与 GPT Store 的集成无法运行。
不过,Windows 版 ChatGPT 可以预览具有推理功能的 OpenAI o1 模型。同时允许用户将文件和照片上传到 ChatGPT,让它汇总文档,并通过 OpenAI 的 DALL-E 3 图像生成器创建图像。
与适用于 macOS 的 ChatGPT 应用程序一样,适用于 Windows 的 ChatGPT 应用程序可让用户在工作时将其最小化为与其他应用并排的小「配套」窗口。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-18-2
07
WEEKLY NEWS
英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了
英伟达又开源了一个性能超级强大的模型 —— Llama-3.1-Nemotron-70B-Instruct,它击败了 OpenAI 的 GPT-4o 等闭源模型和 Anthropic 的 Claude-3.5 sonnet 等开源模型。
从命名来看,显然 Llama-3.1-Nemotron-70B-Instruct 是基于 Llama-3.1-70B 打造而成。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-17-9
08
WEEKLY NEWS
仅8B参数,可与GPT-4媲美,上交大团队构建多语言医学大模型
团队在基准上评估了许多开源大型语言模型(LLM),以及在 MMedC 上进一步进行自回归训练的模型。
他们的最终模型 MMed-Llama 3 仅有 8B 个参数,在 MMedBench 和英语基准上都比所有其他开源模型取得了优异的性能,甚至可以与 GPT-4 相媲美。
该研究以「Towards building multilingual language model for medicine」为题,于 2024 年 9 月 27 日发布在《Nature Communications》。
原文链接:
https://www.jiqizhixin.com/articles/2024-10-17-2
09
WEEKLY NEWS
商汤“夺金”SuperCLUE-V多模态大模型基准10月榜单
商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。
商量多模态大模型API入口(限时免费!):
https://platform.sensenova.cn/doc?path=/model/mllm.md
商汤“商量”注册体验链接:
https://chat.sensetime.com/
原文链接:
https://www.jiqizhixin.com/articles/2024-10-11-8
下期精彩继续