「六块腹肌」不是梦: AI 让你美梦成真

科技   2024-08-23 21:59   上海  


🧬 OpenAI GPT-4 高精度建模基础蛋白质结构

🌏 微软 Phi-3.5 系列 AI 模型

🤖 Meta 推出新型网络爬虫机器人 

🚀 英伟达推出 80 亿参数 AI 模型

🎙️ 微软 Azure AI 语音服务新功能

🛡️ 全球首款自动 Deepfake 检测器

🌟 AI 驱动的蛋白质设计新纪元 CarbonNovo

🌐 国内最大智算中心月底启用

🏢 北京打造全球机器人产业高地

🔍 抖音推出第四款搜索 APP

👥 腾讯会议增强多语言翻译功能

🤖️ 数字华夏「夏澜」人形机器人

📈 LG 电子千万美元投资 AI 初创企业

🚗 奇瑞汽车投资亿元成立开阳科技

💰 Standard Bots 获得 6300 万美元融资

💼 「帝尔博格」完成数千万 Pre-A 轮融资

💪 Gigabody AI 软件:轻松「增肌」

OpenAI GPT-4 高精度建模基础蛋白质结构

OpenAI 的 GPT-4 语言模型在罗格斯大学的研究[1]中展现出了在高精度模拟氨基酸和蛋白质结构方面的潜力。

GPT-4 能够准确预测 20 种标准氨基酸的三维结构,包括原子组成、键长和角度。在模拟 α-螺旋等常见蛋白质结构元素时,GPT-4 显示出与实验确定结构的高度一致性。GPT-4 还成功分析了抗病毒药物 Nirmatrelvir 与 SARS-CoV-2 主要蛋白酶之间的结合,正确识别了相互作用的氨基酸和原子间距离。

微软 Phi-3.5 系列 AI 模型

微软公司最新发布的 Phi-3.5 系列 AI 模型,带来了创新的混合专家模型(MoE)技术,所有 Phi-3.5 系列模型现可在 Hugging Face 平台上以 MIT 许可方式获取。

Phi-3.5-MoE 作为系列中首个混合专家模型,Phi-3.5-MoE 在 16 x 3.8B MoE 模型中仅激活了 66 亿个参数,展现出卓越的性能,在标准 AI 基准测试中表现突出,性能接近当前领先者 GPT-4o-mini。Phi-3.5-vision 拥有 42 亿个参数,增强了对多帧图像的理解和推理能力,显著提升了多项基准测试的性能。Phi-3.5-mini 是轻量级模型,拥有 38 亿参数,支持 128K 上下文窗口,远超其主要竞争对手 Gemma-2 系列的 8K 支持。

Meta 推出新型网络爬虫机器人

Meta 新发布的网络爬虫机器人名为 Meta External Agent,于上月推出,功能与 OpenAI 的 GPTBot 相似,专注于抓取用于 AI 训练的文本数据,如新闻文章和在线讨论。

马克・扎克伯格曾表示,Meta 的社交平台积累了大量 AI 训练数据集,甚至超过了 Common Crawl。新爬虫的推出可能意味着现有数据库需要更新和扩展,以支持 Llama 模型和 Meta AI 的持续发展。根据 Dark Visitors 的数据,全球约 25% 的热门网站已屏蔽 GPTBot,而仅有 2% 的网站屏蔽了 Meta 的新爬虫机器人。

英伟达推出 80 亿参数 AI 模型

英伟达在AI领域再次取得突破,发布了具有高精准度和高计算效率的「Mistral-NeMo-Minitron 8B」AI模型[2]。「Mistral-NeMo-Minitron 8B」是一个小型化的语言AI模型,拥有80亿个参数。该模型通过在搭载英伟达RTX显卡的工作站上运行,实现GPU加速。

英伟达与Mistral AI合作,上月发布了开源的「Mistral NeMo 12B」模型,此次发布的8B模型是在此基础上的进一步创新。「Mistral-NeMo-Minitron 8B」在九项流行语言模型基准测试中表现出色,这些测试包括语言理解、常识推理、数学推理、总结以及生成真实答案的能力。

微软 Azure AI 语音服务新功能

微软Azure AI语音服务通过最新推出的「Text to Speech Avatar」功能,为开发者提供了将文本转换为视频的强大工具,目前已在东南亚、北欧、西欧、瑞典中部、美国中南部和美国西部等地区推出。

开发者可以利用这项功能,将文本转换成仿佛由人类自然说出的视频,视频输出分辨率为1920×1080,每秒25帧,保证了视频的清晰度和流畅性。提供多种人物预设形象,虚拟人形象的声音由Azure AI文本转语音技术支持,确保声音的自然度,支持异步或实时合成文本到语音人像视频,提高了内容生产的效率。在「Speech Studio」中提供内容创建工具,用户可以不编写代码就能创建视频内容,通过「Speech Studio」的实时聊天头像工具,可以启用实时人像对话功能。

全球首款自动 Deepfake 检测器

网络安全领域迎来了一项创新产品,McAfee与联想合作推出了「Deepfake Detector」,有效识别和遏制日益猖獗的AI诈骗活动。该工具的测试版本已邀请美国、英国、澳大利亚的部分联想AI PC用户进行试用,初期支持英语情境。

「Deepfake Detector」经过了超过20万个样本的训练,具备强大的识别能力。该工具不依赖云网络,而是利用联想AI PC中的NPU,在本地进行Deepfake识别,有效保护用户隐私。McAfee强调,这种本地部署方式可以在不牺牲速度的前提下,维护用户的隐私和数据安全。

AI 驱动的蛋白质设计新纪元 CarbonNovo

中国科学院计算所张海仓团队的最新研究成果 CarbonNovo[3],为蛋白质结构和序列的端到端从头设计提供了全新的解决方案。CarbonNovo 通过统一的能量基模型,以端到端方式联合设计蛋白质主链结构和序列。

CarbonNovo 是首个针对所有蛋白质家族的结构-序列联合设计模型,在可折叠性、多样性、新颖性等指标上显著超过基线方法。Network Recycling 技术首次将蛋白质语言模型引入结构设计,利用天然蛋白质序列数据的先验信息。CarbonNovo 不仅适用于蛋白质单体设计,还有潜力扩展至蛋白质复合物设计和条件设计,如多肽、抗体等。

国内最大智算中心月底启用

中国移动智算中心(哈尔滨)节点的超万卡智算集群即将在 8 月 30 日正式投入使用,哈尔滨在人工智能研发领域迈入国内一线城市行列。单集群算力规模国内最大,国产化网络设备组网规模大,融合分级存储规模领先,提供高效、稳定的算力支持,集群故障可实现分钟级定界定位,算力高达 6.6EFLOPS。

根据《智能计算中心创新发展指南》,智算中心的应用可显著带动人工智能核心产业及相关产业的增长。在「十四五」期间,智算中心投资可带动人工智能核心产业增长约 2.9-3.4 倍,相关产业增长约 36-42 倍。

北京打造全球机器人产业高地

2024年世界机器人大会在北京亦庄开幕,北京市副市长靳伟宣布了北京打造全球机器人产业高地的计划。北京将建设具身智能机器人创新中心,利用「天工」和「开悟」两个开源平台,以及具身智能数据体。创新中心将组建机器人共享加工中心,推动精密零部件加工、概念验证和中试测试平台的建设和运营。

北京将坚持产品创新和场景示范的双轮驱动,产业协同和生态优化的共同联动。通过加大应用场景开放力度,实施机器人新品工程和应用场景示范工程,探索「机器人+」应用示范模式,将形成一批标志性场景、服务和业态,如医疗、养老、园林、农业、应急等领域的机器人应用,带动产业发展。

抖音推出第四款搜索 APP

抖音在搜索领域的探索再次加码,最新推出了独立APP「抖音搜索」,打造专注于自身内容生态的搜索引擎。抖音在搜索业务上的发展充满挑战,此前推出的头条搜索、悟空搜索、闪电搜索均未取得预期成功。

与百度、夸克等传统搜索引擎不同,「抖音搜索」主要展示由博主创作的短视频和图文内容。用户可通过关键词搜索,找到综合频道下的短视频和图文内容,同时提供细分频道以实现精准搜索。「抖音搜索」避开了与传统搜索引擎的直接竞争,专注于自身平台内的内容搜索,利用丰富的视频和图文资源。搜索功能的加入为电商、本地生活服务等业务创造了新的商业场景,有助于构建完整的「看 - 搜 - 购」生态,提升转化率。

腾讯会议增强多语言翻译功能

腾讯会议在提升用户体验和国际化服务方面迈出了重要一步,通过引入17种语言的实时翻译功能,极大地方便了不同语言背景用户的沟通和协作。

腾讯会议新增的实时翻译功能支持中文、英语、日语、韩语等17种语言的相互翻译,功能面向企业版和商业版用户,可在会议字幕、实时转写以及录制回放中使用。该翻译功能由「腾讯混元大模型」和「腾讯翻译技术」提供支持,确保翻译的准确性和流畅性。

数字华夏「夏澜」人形机器人

在2024世界机器人大会(WRC)上,数字华夏(深圳)科技有限公司展示了其创新的交互型人形机器人「夏澜」,以其高仿外观、百变人脸和自然语音交互能力成为焦点。「夏澜」机器人旨在突破传统机器人的界限,创造有「温度」的交互体验,与人类建立情感联系。

数字华夏提出了「人形交互机器人」概念,致力于创造能够与人类产生情感共鸣的智能伙伴。「夏澜」机器人的「智慧大脑」AI系统能够展现丰富表情,具有接近真人的高仿外观和流畅的控制系统,机器人配备了「百变人脸」,能够实现自然的表情变化,以及流畅的「丝滑动作」。

LG 电子千万美元投资 AI 初创企业

LG 电子宣布将向由日本软银集团早期风险投资部门 SBVA 管理的「Alpha Intelligence Fund」投资 1000 万美元。AIF 是一支新成立的基金,总规模达 1.3 亿美元,专注于 AI 和深度科技领域的初创企业。LG 电子与软银集团的合作,将结合双方的资源和专长,共同挖掘和培育有潜力的 AI 初创企业,投资有望加速 AI 技术在消费电子、智能家居、企业解决方案等多个领域的应用和发展。

奇瑞汽车投资亿元成立开阳科技

安徽开阳科技有限公司于 8 月 15 日成立,法定代表人为奇瑞控股集团党委书记、董事长尹同跃,注册资本 1 亿人民币,注册地位于安徽省芜湖市经济技术开发区,紧邻奇瑞汽车试验技术中心。

开阳科技的业务涵盖网络与信息安全软件开发、智能机器人研发、人工智能软件开发、云计算技术服务等。公司还涉足量子计算技术服务、电子专用材料研发、新兴能源技术研发等前沿科技领域。尹同跃在 2024 雄狮科技 AI 智能体生态开放大会上提出,奇瑞智能化将聚焦自动驾驶 (Self Driving) 和智能通信 (Self Communication) 两大方向。

Standard Bots 获得 6300 万美元融资

专注于制造业和物流业自动化的公司「Standard Bots[4]」,在AI机械臂领域取得了显著进展,并成功获得了巨额融资。

「Standard Bots」成立于2015年,由Evan Beard和David Golden联合创立,致力于打造易于使用且功能强大的机器人平台。公司的核心竞争力在于其研发能力和技术底蕴,拥有由行业专家和顶尖工程师组成的团队。「Standard Bots」的AI机械臂技术在医疗、制造业和物流业等领域的应用前景广阔,有望推动产业升级和转型。

「帝尔博格」完成数千万 Pre-A 轮融资

帝尔博格(深圳)智能科技有限公司,一家专注于重工领域智能机器人工艺站的企业,近期宣布完成了数千万元的Pre-A轮融资。元禾璞华领投,投控东海跟投,芯湃资本担任财务顾问。融资资金将用于技术产品迭代、市场拓展等。

「帝尔博格」成立于2022年,核心团队来自清华大学、西安交大等,具有丰富的技术研发和产业落地经验。他们瞄准钢铁、船舶、航空航天、新能源制造等领域,并与多家头部企业合作,提供研发、安装、调试等标准化智能单站交付服务。元禾璞华董事总经理陈瑜看好「帝尔博格」团队在智能化算法能力和重工行业经验。投控东海深圳湾天使三期基金CEO陈圳豪认为「帝尔博格」具备市场稀缺性,产品技术得到多家头部客户认可。

Gigabody AI 软件:轻松「增肌」

Gigabody[5] 这款 AI 软件以其一键增肌的功能迅速走红,上线后迅速攀升至免费榜第二名,日下载量超过 15 万次。用户只需上传一张普通照片,选择「一键增强肌肉」,短短 5 分钟内即可获得一副健硕的肌肉身材。尽管 Gigabody 效果惊艳,但有用户反馈成功率并不稳定,有时需要多次尝试才能达到理想效果。软件提供了每 15 分钟一次的免费变身机会,但想要更多滤镜效果则需升级到专业版。

睡眠才是人类真正的活动形态,清醒的时候只是在收集做梦的素材。

——寺山修司

编辑团队

编辑:Yuki

设计:Ivan

商务合作请加微信:Rwkfbcianvd

参考资料

[1]

罗格斯大学的研究: https://www.nature.com/articles/s41598-024-69021-2

[2]

「Mistral-NeMo-Minitron 8B」AI模型: https://developer.nvidia.com/blog/mistral-nemo-minitron-8b-foundation-model-delivers-unparalleled-accuracy/

[3]

CarbonNovo: https://openreview.net/pdf?id=FSxTEvuFa7

[4]

Standard Bots: https://standardbots.com/

[5]

Gigabody: https://top.aibase.com/tool/gigabody


十字路口Crossing
AI 正在给各行各业带来改变,我们在「十字路口」关注变革与机会,寻找、访谈和凝聚 AI 时代的「积极行动者」,和他们一起,探索和拥抱,新变化,新的可能性。「十字路口」是乔布斯形容苹果公司站在科技与人文的十字路口,伟大的产品往往诞生在这里。
 最新文章