「七月」 AI设计观察

科技   2024-07-25 11:57   河北  



【1】智谱AI视频理解模型 革新时间问答能力
【2】腾讯新项目可输入视频生成对齐音频
【3】Vimeo推出新的AI内容标签
【4】字节大模型被苹果收入Core ML模型库
【5】AMD豪掷6.65亿美元收购Silo AI
【6】Claude新功能可快速修改生成内容
【7】夸克「超级搜索框」推出一站式AI服务
【8】抖音VR直播上架Apple Vision Pro
【9】大模型应用产品「心流」宣布正式上线
【10】Canva禁止用户AI生成政治类海报


1.智谱AI视频理解模型 革新时间问答能力


智谱AI宣布,训练了一种新的视频理解模型CogVLM2-Video,并将其开源,该模型可以回答视频时间进度相关问题。据介绍,智谱提出了一种基于视觉模型的自动时间定位数据构建方法,生成了3万条与时间相关的视频问答数据,然后基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入。




2.腾讯新项目可输入视频生成对齐音频


近期,腾讯人工智能实验室的研究团队推出了名为「隐含对齐视频到音频生成」的新模型VTA-LDM,该模型旨在提供高效的音频生成解决方案。这一方法不仅提升了音频生成的质量,还扩展了视频生成技术的应用场景。研究团队在模型设计上进行了深入探索,结合了多种技术手段,以确保生成音频的准确性与一致性。




3.Vimeo推出新的AI内容标签


Vimeo宣布了一个重大更新,加入了YouTube和TikTok的行列,开始要求创作者们对AI生成的内容进行明确标注。这项新规定意味着,所有看起来逼真的视频内容,如果是由AI创造或修改的,都必须向观众披露其来源。Vimeo还特别指出,如果视频使用了平台提供的AI工具,比如可以消除演讲中的长停顿和中断的工具,这些视频也需要被打上AI内容的标签。



4.字节大模型被苹果收入Core ML模型库


字节大模型Depth Anything V2被苹果官方收入Core ML模型库,Depth Anything V2是一个单目深度估计模型,它能够从单张图片中估算出场景的深度信息。这个模型从2024年初的V1版本到现在的V2,参数量从25M扩展到了1.3B,应用范围覆盖了视频特效、自动驾驶、3D 建模、增强现实等多个领域。




5.AMD豪掷6.65亿美元收购Silo AI


AMD近日宣布,将以6.65亿美元的全现金方式收购芬兰人工智能初创公司Silo AI,力图缩小与行业领导者NVIDIA的差距。Silo AI作为欧洲最大的私人AI实验室之一,专注于为企业提供定制化的AI模型和平台。此次收购将使AMD获得Silo AI的300名成员团队,这些成员将使用其软件工具构建定制的大型语言模型(LLM),以加速AMD在AI技术方面的发展。




6.Claude新功能可快速修改生成内容


Anthropic公司推出了最新款AI-Claude 3.5 Sonnet,带来了AI技术的革命。升级新增Artifacts分享和重新混合功能,让用户可以分享和修改游戏、应用程序等,预示着技术平权的新时代已经到来。Claude 3.5 Sonnet在多项基准测试中表现优异,尤其在代码生成方面表现突出。Artifacts功能让Claude从对话助手进化成全能创作伙伴,用户可以生成各种复杂内容并实时编辑和分享。



7.夸克「超级搜索框」推出一站式AI服务


夸克宣布推出全新升级的「超级搜索框」,颠覆传统搜索模式。据介绍,夸克的「超级搜索框」不仅仅是一个搜索工具,更是一个集智能回答、创作、总结于一体的全能助手。用户只需输入问题,即可获得精准的图文和视频回答,无需再在海量搜索结果中逐一筛选,对于复杂逻辑和跨学科问题,夸克AI的深度学习能力能够提供更全面、准确的答案。



8.抖音VR直播上架Apple Vision Pro


抖音集团宣布,抖音VR直播在Apple Vision Pro支持下载体验,登录苹果Apple Vision Pro应用商店,搜索「抖音VR直播」即可下载。据介绍,抖音VR直播在Vision Pro中支持小范围6DoF 3D直播,可实现内容追随,为用户带来立体看播体验。同时,支持 180°、360° 全景直播,即使不在现场,用户也能有身临其境的感觉,实时沉浸式看直播。



9.大模型应用产品「心流」宣布正式上线


大模型应用产品「心流」宣布正式上线,产品定位为用户的AI搜索助手,提供智能搜索、知识问答、智能阅读、辅助创作等能力。据介绍,「心流」支持AI搜索问答,AI阅读分析,学术论文等长文本的检索、阅读、分析和总结等。目前,心流网页版已经上线,小程序版本、APP版本也即将推出。




10.Canva禁止用户AI生成政治类海报


设计巨头Canva已经明确规定了其AI工具可以和不能生成的内容范围。Canva的 CEO Melanie Perkins在接受采访的时候表示,Canva的AI功能名为Magic Media,不与医疗或政治术语一起使用,因为这样的内容可能会有害或不适当。


UI头条
原iconfans,UI中国-专业界面交互设计平台的官方账号。官方消息发布,分享优秀设计文章,UI招聘相关信息,行业消息,服务UI设计师群体!
 最新文章