江湖要闻 | 特仑苏发布广告《更好生长》;快手举办首届「村奥会」;阿里达摩院推出AI视频制作工具寻光;支付宝发布多模态医疗大模型

科技   2024-07-09 17:26   北京  




案例速递



特仑苏发布小暑广告片《更好生长》


在小暑时节,特仑苏与《人物》杂志联合推出广告片《更好生长》,短片特别邀请了北京大学历史学系的知名教授罗新,与广大观众共同踏上一场关于想象与成长的探索之旅。



霸王茶姬×刘翔发布广告片《为热爱 更为在一起》


霸王茶姬携手刘翔发布广告片《为热爱 更为在一起》,希望借助无国界的体育精神,一起致敬跨过的时光。



CASETiFY×红山森林动物园发布联名系列


CASETiFY官宣与南京市红山森林动物园发布联名系列,以可爱三宝美洲豹「里昂」、白面僧面猴「杜杜」及水獭「澜沧」的动画形象为灵感印花,推出包括手机壳、耳机壳等在内的多款产品。





公司动态



快手举办首届「村奥会」


作为本届奥运会持权转播商,快手于7月5日至7月7日在贵州榕江特别举行「村奥会」,将顽强拼搏的体育精神与群众体育全民参与的热烈氛围彼此融合,让体育走进用户的日常工作生活,走进田间地头,焕发别样活力。



苹果Apple Intelligence功能或将在明年春季上线


Mark Gurman表示苹果或将会在2025年春季发布的iOS 18.4版本中向所有用户提供Apple Intelligence人工智能系统。届时苹果将会带来更智能的Siri系统,并为用户带来更全面的AI功能体验。而在此之前,苹果将会在今年秋季推出部分AI功能,包括整合ChatGPT接口、全新Siri UI等等。(新闻来源:品玩)


泡泡玛特首个LABUBU主题店落地曼谷


7月5日,泡泡玛特LABUBU IP主题店在曼谷MEGA BANGNA商场正式开业,开业首日营业额突破1000万元人民币,创造了海外门店单日销售新记录。2023年5月,泡泡玛特宣布正式进军泰国,同年9月泰国首店开业,目前泡泡玛特在泰国已经开出了6家线下门店。





人工智能



快手大模型首次集体亮相


快手大模型在世界人工智能大会期间首次集体亮相。快手高级副总裁、主站业务与社区科学负责人盖坤介绍,快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型(可图、可灵)为核心的大模型矩阵,覆盖内容生产、理解、推荐等多个层面,并深度服务快手的商业生态场景。其中,推荐模型SIM参数规模已达到十万亿的参数规模,下一代推荐大模型架构ACT预估每天可为快手带来4亿分钟的时长增长。



阿里达摩院推出AI视频制作工具寻光


阿里巴巴达摩院在WAIC推出了一站式AI视频平台寻光,可以帮助用户快速完成视频创作全过程。据悉,寻光集成了剧本创作、分镜设计、视频素材编辑等关键步骤,可以利用AI技术意见创建分镜故事版,还能够为视频创作者利用AI制作专属演员,还能够利用AI根据用户想法生成具备一致性的角色和场景画面,再利用运镜控制、运动编辑创作影片。(新闻来源:机器之心)



支付宝发布多模态医疗大模型,支持千亿级视觉识别


在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言画”全方位的原生多模态能力,能够无缝衔接并深度解析音频、视频、图像、文本等多元化数据,展现出前所未有的数据处理与理解能力。


快手可灵AI网页端上线,所有功能限时免费


快手旗下视频生成大模型工具可灵网页端现已上线,网页端所有功能限时免费开放,用户可以利用文生视频功能生成10秒左右的视频,也可以利用图生视频功能创造新的视频。另外,可灵还为图生视频功能增加了运镜控制、自定义首尾帧等功能。此前快手高级副总裁、主站业务与社区科学负责人盖坤曾透露,已有超过50万用户申请可灵的内测资格。


阿里通义音频生成大模型FunAudioLLM开源,支持情绪语音对话、有声读物等场景


据阿里通义实验室消息,音频生成大模型项FunAudioLLM现已开源。该项目由两个核心模型SenseVoice和CosyVoice组成。CosyVoice专注于自然语音生成,具备多语言支持、音色和情感控制功能,支持中英日粤韩五种语言。SenseVoice则致力于高精度多语言语音识别、情感辨识和音频事件检测,识别效果优于Whisper模型,尤其在中文和粤语上提升超过50%,还具备情感识别和声音事件检测能力,以及快速的推理速度。


商汤发布国内首个所见即所得模型“日日新5o”


商汤科技发布“日日新 SenseNova5.5”大模型体系,并发布国内首个所见即所得模型“日日新5o”,交互效果对标GPT-4o。通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,“日日新5o”可以实现实时的流式多模态交互。据介绍,“日日新5o”能听、会看、更会找话题,就如同“真人聊天一般”,这种交互模式适用于实时对话和语音识别等应用,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出。




数字营销江湖
有营销的地方就有江湖。
 最新文章