1.台积电被曝将应美国要求,从 11 月 11 日起停止向中国大陆供货先进 AI 芯片2.月之暗面创始人被前公司投资人提起仲裁,受理律师回应将提出抗辩3.字节豆包通用图像编辑模型 SeedEdit 开启测试,用户可一句话轻松改图4.OpenAI 带飞两家 AI 创企,先后拿下 20 亿估值5.OpenAI 下一代大模型 Orion 被曝性能提升有限台积电被曝将应美国要求,从 11 月 11 日起停止向中国大陆供货先进 AI 芯片
据外媒报道称,美国已要求台积电从 11 月 11 日开始,停止向中国大陆客户运送常用于人工智能(AI)应用领域的先进芯片。知情人士称,美国商务部致函台积电,对出口到中国大陆的某些 7 纳米或更先进设计的精密芯片实施出口限制,这些芯片用于驱动 AI 加速器和图形处理器(GPU)。英国《金融时报》近日也援引三名知情人士报道了类似消息,其中两名知情人士甚至还称,台积电未来向中国大陆客户供应任何此类半导体都将由华盛顿方面批准。对此消息,美国商务部拒绝置评。而台积电方面的一名发言人也拒绝置评,并声称“台积电是一家守法的公司,我们承诺遵守所有适用规章制度,包括适用的出口管控”。2022 年 10 月,美国政府就已实施了一系列 AI 芯片出口限制措施,向英伟达和 AMD 发出了所谓“知会函”。后来,英伟达由于无法向中国市场提供 A100 和 H100 人工智能处理器,专门为中国市场特供 A800 和 H800 芯片,以绕开美国政府的管制并符合规定。此外,美国政府还向科林研发(Lam Research)、应用材料(Applied Materials)和科磊(KLA)等芯片设备制造商发出信函,限制其向中国出口制造先进芯片的工具。这些信件中的限制措施,后来变成了适用于其他公司的种种规定。《金融时报》则提到,此番报道中的“台积电收紧规定”,可能会影响中国科技巨头们施展其抱负雄心,这些中企已经在为其 AI 云服务设计半导体方面投入巨资,而越来越多的 AI 芯片设计初创公司也已转向台积电寻求制造支持。(观察者网)月之暗面创始人被前公司投资人提起仲裁,受理律师回应将提出抗辩
11 月 11 日消息,月之暗面创始人杨植麟、联合创始人兼 CTO 张宇韬被前公司循环智能时期的投资人在中国香港提起仲裁,相关电子仲裁申请书也已递交 HKIAC(香港国际仲裁中心)。对此,铭德律师事务所资深合伙人 David Morrison 律师回应称:“我们认为该事项既缺乏法律依据,也不具备事实基础,本所将依法提出抗辩。”另据援引知情人士称,本次仲裁的申请方,来自循环智能以及循环智能 7 家投资方中的 5 家:金沙江创投、靖亚资本、博裕资本、华山资本和万物资本。上述知情人士表示,此次仲裁申请可能缘起于,在尚未拿到来自循环智能的几个投资方(金沙江创投、万物资本、靖亚资本、华山资本和博裕资本)的同意豁免书之前,杨植麟和张宇韬等人就已启动融资并创立月之暗面。月之暗面是国内大模型独角兽、Kimi 智能助手开发公司,已获得阿里巴巴等巨头投资。该公司于 2023 年 3 月创立,2023 年 10 月推出全球首个支持输入 20 万汉字的智能助手产品 Kimi。创始团队核心成员参与了 Google Gemini、Google Bard、盘古 NLP、悟道等多个大模型的研发。(IT之家)印奇当选力帆科技董事长,旷视科技科创板IPO之路即将中止
11月12日消息,据报道,力帆科技(集团)股份有限公司(力帆科技)11日下午发布公告称:选举旷视科技联合创始人、CEO印奇为公司第六届董事会董事长,任期自本次董事会审议通过之日起至第六届董事会届满之日止。
随着印奇成为力帆科技董事长,AI独角兽公司旷视科技科创板IPO之路或将中止。旷视科技自2019年谋求赴港上市未果;其后转战科创板IPO,迄今已有1340天。而北京旷视科技有限公司(旷视科技)法定代表人已从印奇更换为唐文斌,因此这意味着唐文斌或将成为旷视科技董事长、法定代表人。
印奇于1988年1月出生。清华大学计算机科学实验班(“姚班”)计算机科学学士学位,哥伦比亚大学计算机科学(智能传感)硕士学位。2011年,印奇与唐文斌、杨沐三位清华大学计算机科学实验班人才,创立了中国AI公司旷视科技。
其中,印奇担任公司执行董事、董事长、首席执行官。他还曾担任第28届中国青年五四奖章获得者,曾连续三年入选《财富》“中国40位40岁以下的商界精英”,福布斯亚洲30U30青年领袖。
成立至今,旷视共完成9轮融资,从资本市场上拿到了近100亿元人民币,估值超过300亿元。其中,蚂蚁集团为旷视大股东(15.08%),与淘宝共同持有29.41%的股份。(钛媒体)
字节豆包通用图像编辑模型 SeedEdit 开启测试,用户可一句话轻松改图
11 月 11 日,字节在豆包大模型团队官网上公布最新通用图像编辑模型 SeedEdit。SeedEdit 支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。目前,该模型已经在豆包 PC 端及即梦网页端开启测试。用户可以在豆包生成图片后,点击继续编辑按钮,输入简单的文本指令对图片背景或主体进行轻松调整,实现一句话改图。此外,用户也可以尝试在豆包 PC 或即梦的图像生成功能中自行上传参考图并进行二次加工。据介绍,在模型数据生产中, SeedEdit 针对数据稀缺问题, 重新设计模型架构,并且采用多模型,多尺度,和多标准的数据制造方案很大程度上解决了数据量,数据多样性和数据质量的问题。作为一款专为图像编辑任务设计的模型,SeedEdit 在通用性、可控性、高质量等方面取得了一定突破。(品玩快讯)李飞飞新动作,推出新视频基准数据集 HourVideo
据斯坦福官方消息,李飞飞与吴佳俊团队联手,推出一个用于一小时视频语言理解的基准数据集,名为 HourVideo。据悉该数据集由一个新颖的任务套件组成,包括总结、感知(回忆、跟踪)、视觉推理(空间、时间、预测、因果、反事实)和导航(房间到房间、对象检索)任务。HourVideo 包含来自 Ego4D 数据集的 500 个人工策划的自我中心视频,时间跨度从 20 分钟到 120 分钟不等,包含 12,976 道高质量的五向选择题。基准测试结果表明,包括 GPT-4 和 LLaVA-NeXT 在内的多模态模型与随机概率相比取得了微弱的进步。与此形成鲜明对比的是,人类专家的表现明显优于最先进的长语境多模态模型 Gemini Pro 1.5(85.0% vs. 37.3%),凸显了多模态能力的巨大差距。(品玩快讯)百度文心一言 AI 绘画功能升级:支持一键生成多比例图片、参考图生成图片
百度 AI 旗下的文心一言 AI 绘画技术迎来了重大升级,这项技术现在支持一键生成多比例图片,极大地简化了新媒体配图的流程。文心一言 AI 绘画技术的专业版允许用户输入所需的图片比例,系统便能自动生成多尺寸图片,覆盖横宽比 2 倍以内的各种需求。例如,只需在提示词中加入“3:4”的比例词,系统就能生成相应尺寸的图片。文心一言智慧生图现在能够绘制任意风格,包括国潮精致风、商务精英局以及写实人像照等多种风格。用户只需输入具体的描述,系统便能生成具有高级质感、细节丰富的图片。这一技术的进步,使得文心一言 AI 绘画技术在语义理解、视觉效果和细节刻画上都有了显著提升。此外,文心一言 AI 绘画技术还支持参考图生成图片,使得人物生成更美观,画面生成更精准。用户可以根据自己的需求,添加模特或者调整风格,以满足不同的内容创作需求。(AIBase基地)AI 医疗和脑科学公司虚之实科技获数千万元 A 轮投资
11 月 11 日消息,AI 医疗和脑科学公司杭州虚之实科技有限公司(简称“虚之实科技”)宣布完成 A 轮融资。据悉,本轮融资由星陀资本领投,AIalpha Ventures 等参与跟投,融资规模数千万元。虚之实科技称,公司本轮融资将主要用于加速国内及海外医疗产品研发、C端及专家市场团队的建设。虚之实科技是一家 AI 医疗和脑科学公司,其率先将数字技术用于各类脑疾病治疗,目前已经获评专精特新和高新技术企业。公司拥有包括脑科学、人工智能、医学、生物工程学、虚拟现实等多个前沿领域的海内外顶尖人才。通过多年努力,虚之实科技已经构建起覆盖精神科、神经内科、儿科、康复科、心理科等多个领域的产品体系,并在国内二十余个省市实现近 500 家医院落地,服务患者超过百万人次。(投资界)“可栗口语”完成数百万元天使轮融资,打造 AI 个性化口语学习平台
AI 口语学习软件“可栗口语”近日宣布完成数百万元天使轮融资,投资方为嘉程资本和源合资本,本轮及后续融资由源合资本担任独家财务顾问。此次融资资金,将主要用于团队扩展、核心技术研发和市场推广。可栗口语成立于 2023 年,致力于通过个性化 AI 学习方案,为用户提供高效的英语口语提升体验。其 CEO 兼创始人周树帆曾在微软互联网工程院担任算法工程师,在深度学习、自然语言处理、多语言模型等领域具备丰富经验。周树帆表示,通过与 AI 对话,用户可以降低语言学习过程中的心理负担。同时,AI 还能根据用户的发音、语法、词汇量和表达习惯等方面提供精准的个性化反馈,提升学习的实用性与效率。周树帆还表示,可栗口语将持续迭代升级其 AI 能力,为用户提供更精准和个性化的学习内容。用户群体也将逐步扩展,满足更广泛的学习需求。(36氪)闪极科技:潘欣出任合伙人,领导 AI 相关技术研发
11 月 11 日消息,闪极科技宣布潘欣正式加入闪极,出任闪极科技合伙人,领导 AI 相关技术研发。据了解,2015 年,潘欣作为 Google Brain 的首位研究软件工程师加入该团队。回国后,他先后在百度、腾讯与字节跳动担任要职,分别构建了无量深度学习框架和推动 AIGC 与视觉大模型平台的开发。公开信息显示,消费类充电和储能产品公司闪极科技成立于 2020 年,旗下核心产品为氮化镓潮玩快充充电器、随行充电宝、固态硬盘等。2021 年闪极科技完成数千万人民币天使轮融资,投资方为光速光合。(钛媒体APP)多模态模型免微调接入互联网,即插即用新框架,效果超闭源商用方案
上海人工智能实验室等联合提出了一种即插即用的框架——SearchLVLMs。该框架可以在推理阶段对大模型进行互联网检索增强,使其无需微调就能对实时信息做出准确反馈。SearchLVLMs 框架主要由三部分组成:查询生成、搜索引擎调用和分层过滤。以视觉问答为例,框架会基于问题和图片生成查询关键词,调用搜索引擎查找相关信息,再通过多层过滤得到有用的信息,最终以提示的形式提供给大模型。实验结果显示,配备 SearchLVLMs 的模型在 UDK-VQA 数据集上的回答准确率比自带互联网检索增强的 GPT-4o 模型高出 35% 。此外,SearchLVLMs 在多种模型上均能带来显著的性能提升。(新智讯)“柯南 AI ”获数百万元天使+轮融资,太和资本出手
11 月 11 日消息,柯南(广东横琴)智能科技有限公司(以下简称“柯南 AI ”)近日完成数百万元天使+轮融资,投资方为太和资本,华峰资本担任长期战略财务顾问,本轮融资资金将用于产品生产制造、供应链优化、市场推广以及加强 AI 产品算法、算力的建设。“柯南 AI ”成立于 2024 年,专注研发 AI+儿童教育产品,定位 AI 赋能方案商。有别于传统 AI+ 教育产品的“机械教育”,“柯南 AI ”聚焦于让孩子了解和使用 AI,培养孩子的想象力,以适应时代的变革。(投资界)天亿马:接入百度、阿里、chatgpt 等大模型进行测试与研发
近日,天亿马在互动平台表示,目前人工智能技术已广泛应用于公司提供的智慧政务等多个领域的综合解决方案或产品中,包括 NLP 自然语言处理、图像识别、语音识别,人脸识别等;在大语言模型方面,公司接入百度,阿里,chatgpt 等通用大模型进行测试与研发,后续将为政务方向等垂直领域大模型做充分的准备。未来,随着公司业务的发展,搭载人工智能的公司产品或系统解决方案将在智慧交通、智慧企业等其他业务领域广泛使用。(财联社)OpenAI 带飞两家 AI 创企,先后拿下 20 亿估值
近期,OpenAI 投资的两家 AI 创业 Anysphere 和 Mercor 均在推进超过 20 亿美元估值的新一轮融资。Anysphere 主要研发了 AI 编码助手 Cursor,可以将开发人员的整个代码库知识融入其建议,OpenAI 曾为 Cursor 提供部分技术支持。目前,该公司已收到投资邀约,估值约为 25 亿美元。OpenAI 以及其投资方 Andreessen Horowitz 和 Thrive Capital Anysphere 同样为 Anysphere 参与过该公司的融资。并且,OpenAI 联合创始人、刚加入 Anthropic 公司的 John Schulman 同样也是该公司的投资者。而另一家创企,AI 人力资源管理公司 Mercor 也正和投资者谈论了以高达 20 亿美元的估值,筹集至少 1 亿美元融资。Mercor 成立于两年前,主要通过人工智能来面试和筛选候选人。据 Mercor 网站称,该公司的市场注册员工超过 30 万,其中包括谷歌和亚马逊的前工程师。同时,Mercor 还是 OpenAI、Meta 的承包商,帮助其寻找 AI 开发人员,以评估其 AI 模型。(硅兔君)谷歌将为苹果 iPhone 推出独立的 Gemini App,支持 AI 语音聊天
据传,iPhone 用户有望以全新的方式与谷歌 AI 助手 Gemini 互动。此前,iPhone 用户只能通过谷歌应用中的特定标签访问 Gemini。而现在,谷歌正在苹果 App Store 上测试一款独立的“ Google Gemini ”应用程序,该应用将提供更多 AI 功能。这款独立的 Google Gemini 应用包含了一个名为 Gemini Live 的功能,该功能允许用户通过语音命令与 AI 进行对话,也是目前 iOS 上无法使用的功能之一 ,该功能自 2024 年 9 月起可供 Android 用户使用。由于谷歌尚未正式宣布 iOS 版 Google Gemini 应用,因此尚不清楚应用何时正式上线。(IT之家)OpenAI 下一代大模型 Orion 被曝性能提升有限
11 月 11 日消息,据外媒报道,OpenAI 即将推出的下一代大语言模型 Orion 的性能提升有限,不如前几代产品进步巨大。据报道,OpenAI 目前已经完成了 Orion 的20%训练工作,其表现接近GPT-4。虽然 Orion 在语言任务中表现出色,但在编码方面表现平平且存在运行成本过高的问题。但也有 OpenAI 的员工指出,Orion 部分接受了 AI 生成的数据训练,这可能导致其性能与旧模型相似。(品玩快讯)英伟达重磅推出:AI视频理解新突破,让机器真正读懂视频内容
NVIDIA 近日对外发布全新的 AI 视频搜索与摘要蓝图( AI Blueprint for Video Search and Summarization ),这一技术方案将彻底改变传统视频分析的局限性。不同于过去仅能识别预设对象的固定模型,新方案通过结合生成式 AI 、视觉语言模型( VLM )和大语言模型( LLM ),实现了对视频内容的深度理解和自然交互。这套系统建立在 NVIDIA NIM 微服务架构之上,核心优势在于其强大的视频理解能力。通过将视频分段处理、密集描述生成和知识图谱构建等技术有机结合,系统可以准确理解和分析超长视频内容。用户可以通过简单的 REST API 接口,实现视频摘要生成、互动问答,以及对实时视频流进行自定义事件监控。目前,NVIDIA 已开放该技术方案的早期访问申请。开发者可以通过 NVIDIA 提供的 API 目录选择合适的模型,既可以使用 NVIDIA 托管的服务,也可以选择本地部署方案。(AIBase基地)Anthropic 发布新型 token 计数 API ,支持多种 Claude 模型
近期,Anthropic 推出了全新的 token 计数 API,旨在提供更深入的令牌使用洞察,从而提升与语言模型的交互效率和控制能力。Anthropic 的 token 计数 API 使得开发者能够在不直接调用 Claude 模型的情况下进行令牌计数。该 API 可以测量提示和响应的 token 数,且在计算资源的消耗上更加高效。这种预先的估算功能使得开发者能够在发起实际的 API 调用之前,对提示内容进行调整,从而优化开发过程。目前,该 token 计数 API 支持多种 Claude 模型,包括 Claude3.5Sonnet、Claude3.5Haiku、Claude3Haiku 和 Claude3Opus。开发者可以通过简洁的代码调用 API 来获取 token 的数量,无论是使用 Python 还是 Typescript,都可以轻松实现。(AIBase基地)Salesforce 计划招聘 1000 名员工推动 AI 产品销售
Salesforce 近日宣布,计划在未来招聘超过 1000 名员工,以支持其新推出的生成性 AI 代理产品“ Agentforce ”的销售。这款产品能够在无人监督的情况下完成客户支持和销售开发任务,初步定价为每次对话 2 美元。首席执行官马克·贝尼奥夫表示,此次招聘是为了充分利用“ Agentforce ”带来的“巨大动力”。这款产品自两周前发布以来,已经收到了客户的热烈反馈。作为全球最大的客户关系管理软件供应商,Salesforce 在今年对其 AI 战略进行了重大调整,专注于开发能够独立完成任务的智能代理。(新智讯)Suno 发布 V4 音乐生成模型音频演示视频,音质和风格大提升
近日,Suno 公司发布了其最新的 v4 音乐生成模型的音频样本。这些演示音频展现了与之前版本相比,音质、音色多样性和一致性都有了显著提升。Suno 的 v4 模型通过深度学习技术对大量音乐数据进行训练,旨在生成更自然、更丰富的音乐作品。与以往版本相比,v4 模型在音频合成方面的表现更为出色,能产生更具表现力的乐曲,增强了音乐的情感表达。听众在试听样本时,能够明显感受到音质的细腻程度和旋律的流畅性,给人以耳目一新的体验。通过对不同风格和流派的音乐数据进行学习,v4 模型能够生成多种风格的音乐,满足不同听众的需求。此外,模型在保持音乐一致性方面也有所改进,无论是在旋律、节奏还是和声方面,v4 都能够保持高度的协调性。(站长之家)AI 影响建筑业:美国私人数据中心建设开支激增至近 300 亿美元 / 年,超 2022 年底两倍
11 月 11 日消息,美国公司正大手笔投资数据中心,力图在人工智能领域中抢占先机。根据最新的美国人口普查局数据,美国私人数据中心的建设开支已激增至每年近 300 亿美元(当前约 2153.32 亿元人民币),是 2022 年底 OpenAI 推出 ChatGPT 时支出的两倍以上。金管理公司 KKR 的数据称,美国“引领着数据中心投资的浪潮”,全球相关支出预计将达到每年 2500 亿美元(当前约 1.79 万亿元人民币)。目前,数据中心行业受益于 AI 的发展,对更强大计算能力的需求正在持续增长。此外,数据中心还需要大量电力,这引发了人们对科技巨头或将要求更多发电份额的担忧,且可能推高家庭及其他企业的用电成本。上周,美国主要能源监管机构否决了一项特别协议,该协议原本允许亚马逊公司的一个数据中心从邻近的核电站获取更多电力。(IT之家)麻省理工研究:生成式 AI 未能对世界形成连贯的理解
麻省理工学院的最新研究揭示,尽管生成式 AI 模型(如 transformer 模型)在导航等特定任务中表现出色,但它们并未真正形成对城市结构的连贯理解。研究发现,生成式 AI 能够提供近乎完美的逐步导航,但一旦地图发生细微变化,如关闭某些街道,模型准确率会大幅下降。这表明,AI 模型生成的城市地图其实是“虚构的”,并未真正掌握现实中的地理结构。研究显示,当前生成式 AI 对世界的“理解”并不连贯,这在实际应用中可能引发问题。(大G.AI商业)Near 的跨链 AI 助手即将可用于在 Web2 网站上预订航班或订购外卖
11 月 11 日消息,Near Protocol 推出了一款新的 alpha 级跨链 AI 代理,可以在几秒钟内启动 Meme 币,并通过网络搜索以法定货币购买产品。即将推出的附加功能预计将使用户能够在 Web2 网站上预订航班或订购外卖。Near 的 AI 助手在当前 AI 代理中的独特之处在于链式抽象技术,该技术使用户只需签署交易即可将任何资产交换为任何其他资产。这款名为 Near Intents 的产品目前处于测试阶段,且有交易限制,目前支持比特币、以太坊、Arbitrum、Base 和 Near Protocol 之间的原生资产交换。(PANews)