“ 贻误时机或张惶失措,就等于丧失一切。”
文|小鱼
5、腾讯发布MoE大语言模型
6、智谱AI概念震荡反弹 豆神教育触及20cm涨停
▌IPO/投融资
深度原理是一家AI+Chemistry科技创新服务商,专注于人工智能驱动化学领域的科学研究,致力于通过人工智能技术加速材料化学创新。公司结合深度学习(Deep Learning)和第一性原理思考(First Principles),重新深入解构分子世界运行原理。旨在融合人工智能(AI),量子化学(Quantum Chemistry)和高通量实验(HTE)技术,通过AI决策模型和生成式AI在化学反应中的应用,形成多级、多精度的工作流程,颠覆传统「自上而下实验试错」的化学材料发现模式,加速化学材料研发创新。
2、通用型仿生人形机器人研发商「月泉仿生」完成1亿人民币Pre-A轮融资,由洪泰基金领投,长兴基金、启航投资跟投。
月泉仿生是一家通用型仿生人形机器人研发商,专注于从事人形机器人本体、核心零部件及仿生智能装备的研发和产业化。核心业务涵盖仿生运动智能、仿生健康系统与装备、仿人机器人等为方向的仿生科技研发、推广。已实现机器人整机结构、核心结构件、动力系统等全链条自研,并提出了如仿生韧带等具备柔性和高强度耐用的新材料编织生产方式等。
3、通用航空动力装置研发商「鸿鹏航空」完成数千万人民币A+轮,由大横琴集团领投,银珠资本、超越摩尔基金跟投。
鸿鹏航空是一家通用航空动力装置研发商,公司专注于航空发动机的设计、研发、生产和维修保障业务,已形成包括涡桨、活塞、混动增程动力系统在内的多层次产品体系。旗下产品包括D系列重油活塞发动机、G系列汽油活塞发动机、TP系列涡桨发动机和E系列混动增程动力系统。
4、工业应用领域声学检测AI技术研发商「谛声科技」完成股权投资,投资方为港铁公司。
谛声科技是一家工业应用领域声学检测AI技术研发商,致力于为工业智造、能源、电力、轨道交通客户提供AI智能声学故障检测、运维等多元化解决方案。基于声学监测技术原理,已推出两款设备监测产品:一款是融合了大型麦克风阵列和摄像头的声学相机(也称声像仪),另一款是基于小型分布麦克风阵列实现故障信号的模式识别设备——Cap(又名智能工业听诊器)。
11 月 5 日消息,腾讯混元今日开源了 Hunyuan3D-1.0 大模型,官方称这是首个同时支持文生和图生的 3D 开源大模型。
模型采用两阶段生成方法,官方表示在保证质量和可控的基础上,10 秒即可生成 3D 资产:
第一阶段,团队采用了一种多视角扩散模型,轻量版模型能够在大约 4 秒内生成多视角图像。这些多视角图像从不同的视角捕捉了 3D 资产的丰富的纹理和几何先验,将任务从单视角重建松弛到多视角重建
第二阶段,团队引入了一种前馈重建模型,利用上一阶段生成的多视角图像。该模型能够在大约 3 秒内快速而准确地重建 3D 资产。重建模型学习处理多视角扩散引入的噪声和不一致性,并利用条件图像中的可用信息高效恢复 3D 结构
最终该模型可以实现输入任意单视角实现三维生成
官方表示该模型的泛化能力和可控性强,可重建各类尺度物体,大到建筑,小到工具花草。(IT之家)
11 月 5 日消息,昆仑万维天工 AI 今日发布最新版本的 AI 高级搜索功能,迎来四个方面的升级:
全面升级多层次分析推理能力
升级的金融投资专业 AI 搜索
升级的科研学术专业 AI 搜索
针对文档 AI 阅读分析的智能优化(IT之家)
11 月 5 日消息,Anthropic 昨日(11 月 4 日)发布博文,宣布开发者可以通过第一方 API、Amazon Bedrock 和 Google Cloud 的 Vertex AI,调用 Claude 3.5 Haiku 模型。
Claude 3.5 Haiku 对标的是 OpenAI 的 GPT-4o Mini 和谷歌的 Gemini 1.5 Flash,在多项 AI 基准测试中超越了 Anthropic 上一代中最大的模型 Claude 3 Opus。
Anthropic 表示目前 Claude 3.5 Haiku 模型仅上线文本模态,未来将支持图像输入。
不过最令开发者感到惊讶的是产品 API 定价,每百万 tokens 输入售价为 1 美元、每百万 tokens 输出售价为 5 美元,通过提示词缓存可节省最多 90% 的成本,通过 Message Batches API 可节省 50% 的成本。
查询公开资料,OpenAI 的 GPT-4 mini 模型的每百万 tokens 输入售价为 0.15 美元、每百万 tokens 输出售价为 0.6 美元(IT之家备注:当前约 4.3 元人民币)。
谷歌的 Gemini 1.5 Flash 模型在提示词小于 12.8 万个 token 情况下,每百万 tokens 输入售价为 0.075 美元、每百万 tokens 输出售价为 0.3 美元;超出 12.8 万个 tokens 情况下,每百万 tokens 输入售价为 0.15 美元、每百万 tokens 输出售价为 0.6 美元。(IT之家)
11 月 5 日消息,Google Research 展示了一种使用人工智能读取手写内容的新方法,名为 InkSight 的系统能够直接从手写文字的图片中提取出数字文本,无需任何中间设备。
传统的手写文字识别技术主要依赖于光学字符识别 (OCR),但这种方法在处理复杂背景、模糊不清或低光照条件下的手写文字时往往表现不佳。InkSight 则采用了不同的思路,通过模仿人类学习阅读的过程,即通过不断地重写文本,来学习整个单词的外观和含义。这需要研究人员训练 AI 模型,使其能够识别和模仿人类的手写风格。
InkSight 在处理复杂场景时表现更为出色,例如当照片光线昏暗、文本部分遮挡或背景干扰时,InkSight 能够更准确地识别手写文字。研究人员发现,人类能够阅读 InkSight 生成的文本描摹的准确率高达 87%,其中三分之二的描摹结果与真实手写几乎无法区分。
对于喜欢手写的人来说,InkSight 具有巨大的潜力。想象一下,只需将手写笔记拍摄照片,即可立即将其转换为可搜索的数字文本。对于那些字迹潦草的人来说,InkSight 可以将难以辨认的手写内容转化为清晰、准确的打印文本。
从更广阔的视角来看,这项技术对于破译和和将几个世纪以来的手写文本转换为数字形式具有重要意义。即使对于那些数字化程度较低的语言,InkSight 也能帮助保护手写遗产,并为这些语言的数字化训练提供更多资源。
谷歌并不是唯一一家致力于开发手写识别 AI 工具的公司。亚马逊的 Kindle Scribe 电子阅读器也具备将手写笔记转换为可读文本的功能。此外,Goodnotes 等数字笔记应用也推出了手写识别和编辑功能,可以将手写文字转换为可编辑的数字文本。(IT之家)
▌股市风云
1、腾讯发布MoE大语言模型
11月5日,腾讯发布Hunyuan-large。据官方数字,该模型是业界参数规模最大的开源MoE(专家)大语言模型,总参数389B,上下文长度256K,模型层数64层,用到了合成数据。腾讯机器学习平台总监康战辉表示,今天业内用的更多还是自然数据,但自然数据增长跟不上模型的需求。(第一财经)
2、智谱AI概念震荡反弹 豆神教育触及20cm涨停
▌好文推荐
推荐阅读