阿里巴巴元境大裁员,业务重点将转向元宇宙应用;微软AI主管谈AI趋势:大小模型将齐头并进;字节推出AI社区产品 丨AI情报局

科技   2024-11-04 08:27   广东  

要闻提示


NEWS REMIND

1.阿里巴巴元境大裁员,许多员工上月底 last day,未来业务重点将转向元宇宙应用
2.微软 AI 主管谈 AI 趋势:大小模型将“齐头并进”,“规模法则”远没有到极限
3.字节跳动推出 AI 社区产品 Lumi,赋能内容创作者的新平台 
4.微软计划斥资近 100 亿美元租用 CoreWeave AI 服务器
5.谷歌 Agent 首次发现真实世界代码漏洞!抢救全球数亿设备,或挽回数十亿美元损失?
今日头条


HEADLINE NEWS

阿里巴巴元境大裁员,许多员工上月底 last day,未来业务重点将转向元宇宙应用

据多家媒体报道,阿里巴巴旗下的元宇宙服务品牌“元境”近日进行了大规模裁员,10 月 31 日是许多员工的最后工作日,裁员涉及了杭州和上海的团队。元境相关负责人解释称,“随着元境在元宇宙基础设施层面的建设基本完成,业务重点已转向元宇宙应用,因此进行了组织调整。”元境作为阿里继 YunOS 之后的又一操作系统项目,原本被定位为元宇宙操作系统。

阿里元境是阿里巴巴在元宇宙领域的一项重要布局。2021 年,随着 Meta 更名掀起元宇宙热潮,阿里巴巴迅速投入资源组建元境团队,力图在这一新兴领域抢占先机。早在 2019 年,阿里云游戏事业部成立之初,元境就作为技术提供方参与其中。2021 年 9 月,“元境”品牌正式发布,10 月推出云游戏开发者平台,全面进军元宇宙领域,目标是成为元宇宙时代的“安卓系统”。
公开信息显示,元境致力于为元宇宙提供全场景的实时高性能计算能力,结合 3D、AI、实时云渲染等技术,为元宇宙的基础设施、技术工具、创新应用和商业运营提供一体化的全栈服务。元境根据各行业对 3D 实时内容 AIGC 的需求,已推出包括工业制造、商业零售、文旅文创、政务、电商、汽车、泛娱乐、教育等领域的行业解决方案。然而,元境面临诸多问题,市场教育成本远超预期,企业多持观望态度,2023 年企业级客户数量仅达预期 30%。生态建设遇瓶颈,开发者数量不足,平台工具链不完善,商业化渠道有限。(Z Finance)
国内资讯


DOMESTIC NEWS

字节跳动推出 AI 社区产品 Lumi,赋能内容创作者的新平台

11 月 1 日,字节跳动正式推出其全新 AI 社区产品“炉米 Lumi ”,这款工具旨在为 AI 模型的分享、管理和训练提供一个全面的平台。目前,Lumi 仍处于内测阶段,仅支持抖音以及手机号码登录。

作为一款专注于 AI 模型的分享平台,平台允许用户自由上传和展示自己开发的 AI 模型,促进用户间的技术交流与合作。同时,Lumi 提供 Workflow 搭建功能,使用户能够根据需求组合不同模型,构建个性化的 AI 工作流程。此外,平台还推出了 LoRA 训练功能,简化模型的微调过程,确保通用模型能够更好地应用于特定场景。这些创新功能的设立,旨在吸引广大的 AI 开发者和创作者,形成一个活跃的技术社区。
在技术基础上,Lumi 采用了先进的机器学习和深度学习算法,支持多模态 AI 应用,提升了用户的创作体验。在实施 LoRA 微调时,用户可以通过简明的界面调整模型参数,不再需要深入复杂的技术细节,便于更多非专业用户参与 AI 创作。从用户体验的角度来看,Lumi 的设计考虑到了多种使用场景。无论是想通过 AI 生成艺术作品的画家,还是需要自动化文本生成的写作者,都可以在 Lumi 找到合适的工具和支持。此外,平台的互动性和分享机制将激发用户之间的协作,形成良好的社区氛围。(搜狐网)

华西医院联合华为数据存储发布“华西黉医”医学大模型:集成 10 余类通用模型和 50 余类垂域模型

在 11 月 2 日的 2024 四川大学华西医院管理大会上,华西医院联合华为数据存储发布“华西黉医”医学大模型。

据介绍,“华西黉医”医学大模型集成 10 余类通用模型和 50 余类垂域模型,融合 110 万条医患对话集、1600 余份共识指南、150 余部权威教材、100 余部医学政策法规、3.5PB 原始影像数据和 250 余万的病历数据,构建 720 亿参数级的全自主知识产权的“华西黉医”医学大模型。
华西医院还联合华为基于 FusionCube A3000 训 / 推超融合一体机和 AI 全流程工具链 ModelEngine 建立三条医学大模型生产线,使能大模型全流程开发。华为云官网现已提供医疗智能体业务,该智能体基于华为云 AI 和大数据技术,为基因组分析、药物研发、临床研究三个领域提供专业 AI 研发平台。(IT之家)

支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星辰语音大模型升级

近期,中国电信人工智能研究院(TeleAI)星辰语音大模型的多方言能力再次升级,攻克了湛江话、宜宾话、洛阳话、烟台话等方言,将方言种类从 30 种提升至 40 种,并引入对英文的识别。与传统的有标注训练方法相比,TeleAI 通过预训练语音识别模型,利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。

由于方言语音数据普遍存在无标注数据多而有标注数据少的特点,这种“预训练 + 微调”的模型方案与方言场景的需求能够高度契合。TeleAI 还在模型结构和成本优化上进行了创新,实现对人工标注数据的需求量大幅降低约 50 倍,且保障模型效果与有监督训练的方言模型水平相当。(IT之家)

夸克发布“灵知”学习大模型,号称考研数学题正确率、得分率比肩 OpenAI o1

11 月 1 日消息,夸克宣布全面升级“ AI 搜题”产品,用户可通过手机、平板、电脑等设备搜到各类新题和难题,AI 还会分步骤进行题目讲解,并支持用户随时提问。据介绍,夸克 AI 还可围绕题目中的知识点与考点进行深度讲解,精准定位关键步骤,能够以“启发式”学习的体验让用户不仅学会这一道难题,还能举一反三学会一类题。

同时,夸克发布“灵知”学习大模型。官方此次表示,在最新评测中,夸克“灵知”学习大模型在考研数学题上的正确率和得分率已经可以比肩 OpenAI 最新发布的 o1 模型。(钛媒体APP)

周鸿祎警告:AI 将首先淘汰不会利用 AI 的人

11 月 1 日消息,周鸿祎发文警示:AI 将首先淘汰不会利用 AI 的人,随后淘汰那些缺乏思考力的人。他指出,随着 AI 工具的普及,写作变得前所未有的简单,但这背后潜藏着深远的影响。周鸿祎强调,AI 公司推广辅助乃至自动写作功能,看似便捷,实则加剧了社会分化:一端是精通写作与独立思考的精英,另一端则是完全丧失书写技能与批判性思维的人群。这种分化远比表面现象更为严峻,它实质上反映了有思想深度与无独立见解者之间的鸿沟。他表示未来能够持续思考、主动求知的人将成为智者,而依赖 AI 自动写作、放弃自主思考的大多数人,则可能逐步退化其思考能力。

他总结道,AI 的发展轨迹是从替代不懂技术应用者到取代缺乏深度思考者。那些不愿主动思考的人,最终可能成为 AI 的附庸,失去对时间、财富乃至人生的掌控权。(快科技)

"驯鹿 AI "完成 6000 万战略融资,布局 AI 智能客服与销售

近日,北京驯鹿智能科技有限公司"驯鹿 AI "(以下简称“驯鹿 AI ”)宣布完成了 6000 万元人民币的战略融资,由 IDG 和盛大资本领投,万世资本和源合资本担任专业顾问。该公司以 AI 客服和销售为核心业务,这笔资金将主要用于技术研发和团队扩充,尤其是高端人才的引进。

"驯鹿 AI "是由清华、斯坦福校友和连续创业者共同创办的 AI Agent 公司,以通用大语言模型(LLM)为基础,通过高度定制化的 AI 解决方案,为不同行业的企业提供 AI 智能客服和销售机器人,帮助企业降本增效。目前,"驯鹿 AI"的业务已覆盖电子商务、金融服务、电信与互联网服务、教育培训、物流与快递、医疗与健康服务以及旅游与酒店业等多个领域,并与行业内的龙头企业建立了合作关系。(True Talents. AI)

多图场景用 DPO 对齐,上海 AI 实验室等提出新方法,无需人工标注

由上海交大、上海 AI 实验室和香港中文大学联合提出的最新研究成果 MIA-DPO,为大型视觉语言模型(LVLM)提供了一种全新的多图像偏好对齐方法。该方法通过将单图像数据扩展为多图像数据,同时设计了序列、网格拼贴和图中图三种数据格式,显著降低了数据收集和标注成本,具备高度的可扩展性。

在视觉语言模型的发展中,理解多图像上下文已成为一个重要趋势,但同时也引发了幻觉问题。多图像场景可能导致模型在识别和处理时产生更复杂的幻觉,包括序列混淆和元素干扰等。MIA-DPO 解决了这些问题,并且最大亮点在于无需依赖人工标注或昂贵的 API。研究者通过分析视觉大语言模型在多图像处理中的注意力分布,提出了一种基于注意力的选择方法(Attention Aware Selection),能够自动过滤掉无关图像的错误答案,从而构建出一种低成本且自动化的 DPO 数据生成方式。(量子位)

豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍

近期,字节跳动与香港大学合作,推出了一款名为 HybridFlow 的高效强化学习和强化学习人类反馈框架。这一框架旨在解决大模型训练中的复杂性和效率问题,显著提升了训练吞吐量。

HybridFlow 采用混合编程模型,结合了单控制器的灵活性和多控制器的高效性,解耦了控制流和计算流。通过 Ray 的分布式编程、动态计算图和异构调度能力,实现了高效的数据处理和算法执行,支持多种分布式并行框架,满足不同模型规模的计算需求。实验结果显示,HybridFlow 在 PPO、ReMax 和 Safe-RLHF 等多种 RL 算法下,训练吞吐量相比其他框架提升了 1.5 倍至 20 倍。(新智讯)

医疗机器人企业“奥达智声”获数千万元 A 轮融资,前海方舟大健康基金出手

11 月 1 日消息,智能医疗机器人系统、器械及智能医疗综合解决方案提供商——北京奥达智声医疗科技有限公司(简称“奥达智声”),宣布完成由前海方舟大健康基金独家投资的数千万元 A 轮融资,黄蜂资本担任本轮融资财务顾问。

奥达智声自主研发了木星-智能软组织穿刺介入导航手术机器人。这是一款专注于为微创癌症疗法提供系统解决方案的高性能机器人,能够在实时超声引导下,与术前 CT 进行多模态影像融合,清晰准确锁定病灶目标,无放射危害。该系统融合了临床医学、医学影像、导航、AI 、机器人、先进制造及医学材料等技术,解决临床超声介入手术过程中肿瘤消融面临的肿瘤难以识别,穿刺路径难以精准设计和控制的难题。实现术前规划与术中导航自动结合,为穿刺和消融治疗提供全流程解决方案,帮助医生精准定位病灶、实施精准穿刺。
据悉,木星-智能软组织穿刺介入导航手术机器人 90% 以上的零部件已经实现了国产化,将手术机器人的成本从原先的上千万和近千万,降低到了与一台旗舰超声设备接近的市场价格。该产品现已经提交NMPA注册申请。(投资界)

情感大模型品牌“中聚源”发布全周期心理健康数字化解决方案

近日,情感大模型品牌中聚源智能科技表示,自主研发智能心理监护系统、智能心身测评一体机、智慧交互式干预座舱等多款产品,形成以“预防-预警-干预为核心的全周期心理健康数字化解决方案。目前,已应用于国防、教育、司法、公安、交通、医疗等领域。

合肥中聚源智能科技有限公司成立于 2021 年 8 月,是由合肥综合性国家科学中心人工智能研究院发起成立的一家致力于人工智能技术研发和应用的高新技术企业。公司在发展的过程中采用自主研发+成果转化模式构建全面的知识产权体系,累计获得发明专利及软件著作 50 个以上。中聚源将推动 AI 技术在心理健康领域的应用,同时也为用户提供了更高质量的情感支持与服务。(36氪、CSDN)
国际资讯


FOREIGN NEWS

微软计划斥资近 100 亿美元租用 CoreWeave AI 服务器

11 月 2 日消息,CoreWeave 表示,微软计划在 2023~2030 年间花费近 100 亿美元(当前约 712.77 亿元人民币)从该公司这里租用服务器,以运行 AI 模型。CoreWeave 对投资者表示,这一金额比以前所知的要大,占 CoreWeave 与客户签署的 170 亿美元(当前约 1211.71 亿元人民币)合同总额的一半以上。CoreWeave 和微软没有立即回应置评请求。

公开资料显示,被称为“AI 算力黄牛”的初创公司 CoreWeave 成立于 2017 年,备受英伟达青睐,正在为 2025 年的首次公开募股(IPO)做准备。此外,CoreWeave 最近还从几家投银获得了 6.5 亿美元(当前约 46.33 亿元人民币)的信贷额度,而且 CoreWeave 在过去 12 个月中还筹集了 127 亿美元的股权和债务融资,包括 5 月的 75 亿美元债务融资。它还在 2023 年 8 月从部分投资者那里筹集了 23 亿美元的债务 —— 以英伟达的人工智能芯片作为抵押品。(IT之家)

科技巨头联手:微软与 a16z 罕见携手呼吁放松 AI 监管

微软与风险投资公司 A16Z 近期达成共识,携手对抗日益严格的人工智能(AI)监管两家公司在一份联合声明中指出,当前的监管措施可能会抑制创新,限制初创企业的发展。尽管微软和 A16Z 在过去曾因对 AI 技术的不同看法而存在分歧,但他们现在一致认为,过度的监管将对整个行业产生负面影响。
微软总裁布拉德·史密斯(Brad Smith)和A16Z的创始人安德森(Marc Andreessen)均表示,AI 技术的发展潜力巨大,应该通过鼓励创新而非实施繁重的监管来实现国家安全和经济增长的双重目标。两家公司强调,政府应当与技术社区合作,而不是将其视为潜在威胁,以便共同推动技术进步和经济繁荣。(AI Daily Insights)

微软 AI 主管谈 AI 趋势:大小模型将“齐头并进”,“规模法则”远没有到极限

在近日的一次访谈中,微软 AI 主管 Mustafa Suleyman 深入探讨了人工智能领域的最新趋势。他认为,未来几年 AI 模型将呈现大小模型“齐头并进”的趋势。一方面,大型模型的规模化竞赛仍将持续,并融入更多模态的数据,例如视频、图像等。另一方面,利用大型模型训练小型模型的技术(如蒸馏)兴起,高效的小型模型将在特定场景中发挥巨大作用。Suleyman 补充称,未来,知识将被浓缩到更小、更便宜的模型中,嵌入各种设备,实现真正的环境感知革命。

对于创业者而言,Suleyman 认为,理解并利用提示工程至关重要。通过提供高质量的指令集,创业者可以引导预训练模型,使其符合自身品牌价值观,打造独特产品。此外,小型模型蕴藏着巨大机会,创业者可以利用其低成本和高效性,开发针对特定用例的应用。
采访中,Suleyman 还强调了数据整合的重要性。合成数据将成为训练模型的关键,但如何获取、整合这些数据仍需深入探讨。此外,这位微软 AI 主管还谈到了新模式的加入,例如视频和图像的整合,以及跨复杂数字界面的动作轨迹的理解和数据收集。他认为,这将带来许多令人印象深刻的结果。对于企业家来说,如何利用这些新趋势和技术进行创新,将是未来成功的关键。(鞭牛士)

谷歌 Agent 首次发现真实世界代码漏洞!抢救全球数亿设备,或挽回数十亿美元损失?

谷歌的 Big Sleep 项目最近取得了一项突破性成果,其 AI Agent 在 SQLite 数据库中发现了一个真实世界的安全漏洞。这是 AI 首次在广泛使用的现实软件中识别出未知的、可利用的内存安全问题。SQLite 是一款广泛使用的开源数据库引擎,其漏洞可能被攻击者用于数据泄露、系统入侵或破坏,潜在损失可能高达数十亿美元。AI 在官方发布版本之前发现了这一漏洞,避免了对用户的影响。

Big Sleep 项目由谷歌 Project Zero 和 Google DeepMind 合作,旨在探索大型语言模型(LLM)在识别和演示安全漏洞方面的潜力。项目采用了一个利用 LLM 辅助的漏洞研究框架,通过在 Meta 的 CyberSecEval2 基准测试上提升了性能,展示了这种方法的有效性。AI Agent 发现的漏洞是一个栈缓冲区下溢漏洞,存在于 SQLite 中的 seriesBestIndex 函数。该函数在处理包含 rowid 列约束的查询时,导致写入了带有负索引的堆栈缓冲区,从而可能产生潜在的可利用漏洞条件。
该项目通过提供一个具体的起点,比如此前修复的漏洞的详细信息,降低了漏洞研究中的不确定性。同时,AI Agent 通过与目标代码库的交互,模仿人类安全研究员的工作流程,使用一系列专用的工具进行代码浏览、运行Python脚本、程序交互和报告进度。谷歌研究者表示,AI 有望帮助防御者找到那些难以通过模糊测试发现的漏洞。Big Sleep 团队将继续推进这项工作,为防御者带来显著优势,并分享研究成果,缩小公共技术前沿和私有技术前沿之间的差距。(学习AIGC)

迪士尼成立新 AI 部门,探索人工智能、混合现实等新型技术的潜力

据报道,华特迪士尼正在组建一个新的小组,以协调公司对人工智能和混合现实等新兴技术的使用,以此来积极探索 AI 等技术在电影、电视和主题公园等业务中的潜力。新成立的“技术赋能办公室”(Office of Technology Enablement)将由杰米・沃里斯(Jamie Voris)领导,他是迪士尼电影制片厂的首席技术官,此前主导了迪士尼为苹果 Vision Pro 混合现实设备开发应用的工作。

迪士尼娱乐联合主席艾伦・伯格曼(Alan Bergman)在邮件中写道:“人工智能和 XR(扩展现实)技术发展迅速,将对未来的消费者体验、创意项目以及我们的业务产生深远影响。因此,迪士尼必须抓住这一激动人心的机遇,同时审慎管理其中的潜在风险。”
迪士尼集团去年成立了一个特别工作组,致力于研究人工智能以及如何将其应用于整个集团,尽管好莱坞的编剧和演员们正努力抵制这项技术的入侵。(IT之家)

雷诺宣布将生成式 AI 引入下一代车载语音助手 Reno,支持 ChatGPT 闲聊

11 月 1 日,赛轮思软件技术公司宣布与雷诺公司深化合作,将生成式 AI 驱动的功能和类人交互引入雷诺下一代多模态虚拟车载伴侣 Reno。

据介绍,雷诺虚拟形象 Reno 是一个智能旅行伴侣,它能带给客户“更加直观和有趣的驾驶体验”。雷诺与赛轮思多年来一直合作,使 Reno 进行人性化的语音交互。雷诺汽车现在将利用由生成式 AI 驱动的 Cerence Chat Pro,进一步提升 Reno 的能力,并将其智能化水平提升至一个全新的高度。Cerence Chat Pro 是智能车规级大型语言模型集成,它将使雷诺客户能够与 Reno 进行有趣且对话式的闲聊,利用包括 ChatGPT 在内的多种资源,随时响应用户各种指令与疑问。此外,Reno 还能借助 Cerence Car Knowledge 回答关于汽车的常见问题,提供来自雷诺官方渠道的信息。(品玩快讯)

领英发布首款 AI 招聘助手,全面开启智能化招聘时代

近日,全球职场平台领英(LinkedIn)在美国凤凰城举办了第 13 届 Talent Connect 。在活动现场,领英发布了多项全新 AI 产品和功能,从人才招聘、组织发展等关键维度赋能全球化企业组织和团队,助力企业管理者在 AI 时代持续打造创新动能。领英中国区总经理王茜指出:“我们看到越来越多的全球企业组织明确表明将在 2025 年专注于投资 AI 技术,并将其应用于人才、品牌和运营等各个业务领域。因为他们意识到拥抱 AI 不仅是为了保持竞争力,更是为了赋能团队,激活人才潜能,从而打造一个更具韧性和创新动力的全球化组织。”

会上,领英官方宣布推出了一款名为 Hiring Assistant 的 AI 工具,可以帮助 HR 进行员工招聘。Hiring Assistant 的目标是帮助 HR 进行耗时的管理工作,以便让 HR 人员能花更多的时间在更核心的工作上。据介绍,Hiring Assistant 可以根据 HR 招聘需求,自动寻找、筛选合格的候选人,甚至自动回答关于职位的基本问题。Hiring Assistant 还能和候选者保持沟通,安排面试,记录会面。(至顶网、品玩快讯)

远程 “闻” 香来了!数字嗅觉公司 Osmo 用 AI 技术实现气味“传送”

最近,一家名为 Osmo 的数字嗅觉公司宣布在“嗅觉传送”技术上取得了重大突破。这项技术的核心是使用气相色谱质谱联用仪(GC/MS)来收集和分析香气数据。

Osmo 公司通过传感器采集某一地点的香气,然后将这些数据传输到一个专门的分子打印机,该打印机能够合成并组合必要的化学物质,精确再现该香气。这项技术早前需要人工参与,但现在 Osmo 成功实现了全自动化,通过 AI 将处理后的香气映射到其“主香气图谱”,这个数据库能够预测特定分子组合与特定气味之间的关系。Osmo 的CEO在社交媒体上表示,他们已经成功数字化了香气,首个实现全自动打印的香气是新鲜的夏季李子。(新智讯)

Suno 新增 AI 歌手克隆功能,一键复刻专属音乐风格

Suno 近期推出的 Personas 功能让用户可以复制自己钟爱的音乐风格,一键生成带有个人特色的 AI 音乐,打造专属音乐 IP。这项突破性功能允许用户将某首歌曲中的核心元素——包括人声特点、音乐风格和情感氛围等进行提取保存,并在后续创作中反复使用。简单来说,如果你特别喜欢某首歌的演唱风格,现在可以将这种风格变成你的"专属标签",让所有新创作都保持一致的个人特色。

值得一提的是,Suno 还为这项功能设计了社交属性。用户可以选择将自己的 Persona 设为公开或私密。选择公开后,这个音乐风格模板将拥有独立页面,其他用户也能借鉴使用,同时会在创作者的资料库和个人主页中展示,让音乐创作变得更有社交价值。(AIbase基地)

ElevenLabs 推开源小项目 X-to-Voice:一键将 Twitter 账号转化为个性化虚拟形象

人工智能公司 ElevenLabs 最近发布了一个开源项目" X-to-Voice ",这款工具能够智能分析 Twitter 用户资料,自动生成与用户个性相匹配的数字声音和动态头像。这个创新项目整合了多个尖端技术:ElevenLabs 自主研发的声音设计 API 负责声音生成,Taedra 工具则掌管动态头像的制作。在技术支持方面,项目采用了 Apify 进行个人资料和图片数据采集,Hedra 负责动态头像的生成,而整个应用则部署在 Vercel 平台上。

该项目的一大特色是其高度的个性化定制能力。系统不仅能够生成符合用户特征的声音,还能创建与之匹配的动态头像,让用户的虚拟形象更加生动立体。生成的内容可以直接分享到社交媒体平台,为用户提供了一种全新的社交表达方式。为了促进技术创新和社区发展,ElevenLabs 已将 Voice Designer API 的完整文档和" X-to-Voice "的源代码公开发布。这一举措不仅展示了项目的技术透明度,也为开发者社区提供了研究和改进的机会。(新智讯)

全球首款 AI 游戏诞生!无需游戏引擎,视频模型直出“我的世界”

11 月 3 日,初创公司 Decart 和 Etched 宣布共同打造了一款世界上首个实时、可玩、可交互的世界模型——Oasis 。Oasis 经过了数百万小时游戏视频的训练,仅接收用户的键盘输入即可实时生成开放世界游戏。游戏允许玩家进行移动、跳跃、拾取物品、打破砖块等操作,生成的视频内容中不仅包含图形学的渲染,也能体现出对物理原则和游戏规则的理解。在没有任何延迟的情况下,Oasis 在 H100 上运行时能以 360p 的分辨率实现每秒 20 帧的渲染,并实时生成视频交互内容。

Decart 成立于 2023 年 9 月,一直致力于提高 AI 模型的效率和降低运行成本,提供更快、更可靠的训练以及实时推理,成立三个月后便与一家 GPU 云服务商达成了数百万美元的交易,红杉资本更是豪掷 2100 万美金对其进行了投资。
Etched 是来自美国的人工智能芯片公司,成立于 2022 年,该公司推出了 Sohu ——世界上第一个基于 Transformer 架构的 ASIC 芯片,专为 LLM 推理加速打造,不仅快过 Groq,也能碾压英伟达最新的 B200。(新智元)

又一 AI 生图模型新宠!Recraft v3 横扫基准测试, 击败 Flux 和 Ideogram 位列第一

近日,图像 AI 初创公司 Recraft 发布了其最新的文本生成图像模型 Recraft v3,最大突破在于能够在一次生成中准确呈现长段文本,而许多其他模型在处理超过几个字时常常力不从心。

在 Hugging Face 的文本生成图像基准测试中,Recraft v3 位列第一,超越了竞争对手 Flux 和 Ideogram。该模型不仅在文本生成方面表现出色,还在保持解剖学准确性、理解提示和制作高质量视觉内容方面表现优异。除了文本生成,Recraft v3 还能生成从简单图标到复杂插图的矢量图形,并配备了多种基于 AI 的图像编辑工具,如 AI 橡皮擦、图像修复、图像扩展、AI 清晰度提升等。(新智讯)
今日热门视频


//

近期热门文章

3D 视觉派:斯坦福具身智能人物关系图


7年的AI芯片销售,决定去开网约车


具身智能构型之争:人形、灵巧手、双足,谁是最终 C 位?

雷峰网
洞见智能未来,共与产业变迁
 最新文章