本文目录(共 18,000 余字)
快手AI概览
快手科技在AI领域的发展历程体现了其对人工智能技术的深度投入和战略重视。
快手在人工智能领域的布局始于2015年底,当时联合创始人兼CEO宿华邀请李岩组建了深度学习部门(DL组),主要利用算法打击盗版和违规内容。次年,深度学习部门更名为多媒体理解组(MMU),进一步涉猎语音、文字、音乐等多种媒体形式,推动快手的AI能力建设从单模态向多模态内容理解的升级。
快手的用户分布广泛、发布内容多样,需要快手的系统能够理解和处理各种不同的场景和用户行为。MMU通过不断的技术创新和优化,逐渐形成了两大业务体系:信息分发和人机交互,前者利用多模态实现精准的视频内容理解,后者利用多模态辅助用户创作以更好地记录生活。在此过程中,快手团队不仅在技术上取得了突破,也在实际应用中证明了AI的价值,为快手的业务和用户快速增长提供了强有力的支撑。
2016年下半年,宿华又力邀清华老同学、斯坦福计算机博士郑文加入并组建 Y-Lab。Y-Lab 的初衷是建立一个类似 Google X 的科技实验室,从事 AI 和 AR 等领域的前沿技术研究以进行前瞻性布局。Y-Lab 先后开发出了多种有趣新奇的 demo,覆盖 AR 特效、人脸识别、手势识别、语义分割等领域。此后快手还成立异构计算与芯片事业部,开始尝试自研AI加速芯片,并以异构集群来系统解决算力问题。
2018年,Y-Lab 实验室更名为 Y-Tech 并加强产品和工程能力,以实现新技术研究往产品落地的无缝对接。自2019年开始,快手AI的技术研发和产品实践正式完成从实验室研究到产品商业化的闭环模式升级,此后陆续推出了包括直播电商、智能硬件等产品体系,团队先后在国际顶会和期刊上发表了过百篇论文。在2020年底公布的招股书中,快手也首次全面披露其在人工智能领域的长期投入和技术积累,以支持其持续的业务增长和未来发展目标。
2022年3月,快手发布2022年财报的同时创始人兼CEO程一笑透露快手在生成式AI方面已进行多年投入,在包括大规模语言模型、多模态预训练、大模型智能创作工具等方面有着深厚的技术积累,他还强调生成式AI与快手的业务场景非常契合、有着巨大的发展潜力。此后,快手陆续推出“快意”、“可图”、“可灵”等自研大模型,并推出一系列生成式AI应用。这些技术和产品覆盖了内容生产、理解、推荐等多个层面,并深度服务于快手的商业生态场景。
目前,快手的AI战略聚焦于直播电商、大模型和智能硬件三大核心业务领域,旨在通过技术创新来推动商业化和用户体验的双重提升。例如,在直播电商场景下,快手AI通过提供特效、美颜、剪辑等功能,增强了直播间的互动性和趣味性,从而提升了用户的购买意愿和转化率。此外,快手还通过大模型技术,如快意语言大模型和可灵视频生成大模型,支持内容创作、信息咨询、逻辑推理等多种任务,为平台的内容和商业生态提供强有力的技术支持。
在快手科技2024年投资者日活动上,快手高层明确表示公司将继续加大在AI领域的投入,以实现公司的长期业务增长和市场竞争力的提升。面向未来,快手在AI领域将强化从直播电商到大模型的全面布局,并通过AI技术重塑内容与商业生态。总之,快手通过全面的AI战略布局和多样化的产品与服务体系,致力于在全球范围内实现高质量增长和商业化变现,在不断推动技术创新和应用的同时,构建智能化生态系统。
产品和服务体系
大模型
可灵:视频生成大模型
可灵AI(Kling AI) 是快手推出的全球首个用户可用真实影像级视频生成大模型,支持文生视频、图生视频、视频续写等功能,并已推出付费会员体系。
官网:
https://kling.kuaishou.com/
Web端:
https://klingai.kuaishou.com/
可灵大模型的核心特性和优势包括:
真实影像级视频生成:可灵AI能够生成真实感极强的视频内容,达到影像级质量,为用户提供高水准的视频创作能力。
多功能性:支持文生视频、图生视频(根据图像生成视频)和视频续写(在现有视频基础上进行内容扩展)等功能,满足不同用户的创作需求。
强大的运动生成能力:采用3D时空联合注意力机制,可灵AI能够建模复杂的时空运动,生成包含大幅度运动的视频内容,同时确保运动的自然和合理性。
长达2分钟的视频生成:得益于高效的训练基础设施和优化的推理技术,可灵AI能够生成长达2分钟、帧率达到30fps的视频,满足更长视频内容的创作需求。
模拟物理世界特性:基于自研模型架构,可灵AI能够模拟真实世界的物理特性,生成符合物理规律的视频,提升视频的真实感。
概念组合能力:结合文本-视频语义理解和扩散变换器架构,可灵AI能够将用户丰富的想象力转化为具体的画面,创造出现实世界中不会出现的场景。
电影级画面生成:基于自研的3D VAE技术,可灵AI能够生成1080p分辨率的电影级视频,无论是宏大场景还是细腻特写,都能生动呈现。
自由的输出视频宽高比:采用可变分辨率训练策略,可灵AI在推理过程中能够输出多种视频宽高比,满足不同场景下的视频素材使用需求。
可灵AI Web端提供了用户友好的界面和工具,用户可以访问AI素材库、AI剪辑工具,能够轻松地创作和编辑视频内容,并参与灵感社区、共享创意和作品。
可图:图像生成大模型
可图大模型(Kolors) 是快手自研的图像生成大模型,它在中文场景下的图像生成性能超越了 Midjourney V5。可图现已开源,允许更广泛的用户和开发者访问和使用,促进了技术的共享与创新。
官网:
https://kolors.kuaishou.com/
开源项目:
https://kwai-kolors.github.io/
可图大模型的核心特性和优势包括:
高性能图像生成:在中文场景下其图像生成性能超越了Midjourney V5,展现了可图大模型在图像生成领域的领先地位。
多样化的AI创作:能够创作出多种风格和主题的图像,主要包括:
传统水墨画风格的荷塘景象,模仿著名画家齐白石的风格,具有细腻的笔触和宣纸纹理。
超高清的动物世界纪录片风格的图像,如8K分辨率的花豹特写,提供视觉盛宴。
活泼女孩的日式动漫风格插图,具有超高分辨率和超现实的细节。
油画风格的猫咪图像,具有浮雕质地和多层次维度。
中国版画风格的古代传说绘本插图,展现中国山水和水墨风格。
美国漫画风格的外星沙漠场景,具有强烈的手绘感。
具有超现实主义风格的白发年轻男子肖像。
其他各种奇幻、科幻和现实主义风格的图像。
AI形象定制:提供AI形象定制功能,允许用户创建个性化的虚拟形象。
高分辨率输出:支持高分辨率图像输出,如8K和16K分辨率,确保图像的细节丰富和清晰度。
丰富的创作灵感:通过在线画廊展示了多种创意图像,为艺术家和设计师提供了丰富的灵感来源。
可图大模型的高性能图像生成能力和开源成果,使其成为图像创作和设计的有力工具,为用户提供了广泛的应用可能性。
快意:大规模语言模型
快意大模型(KwaiYii) 是快手自研的一系列大规模语言模型(LLM),其在中文场景下的综合性能超过GPT-4.0,支持内容创作、信息咨询、逻辑推理等任务。
官网:
https://kuaiyi-test.kuaishou.com/
开源项目:
https://github.com/kwai/KwaiYii
快意大模型的特点和应用包括:
独立自主研发:快意大模型由快手AI团队从零到一独立研发,展现了快手在人工智能领域的技术实力和创新能力。
多种参数规模:包含不同参数规模的模型,以适应不同的应用场景和性能需求。
广泛的应用场景:可以应用于文本生成、对话系统、内容推荐、自动摘要、机器翻译等多种自然语言处理任务。
技术创新:快意大模型采用了先进的预训练技术和微调策略,以提高模型的性能和适应性。
覆盖多种预训练模型:
KwaiYii-Base:基础预训练模型,用于理解和生成自然语言文本,可以支持多种NLP任务。
KwaiYii-Chat:专门针对对话场景优化的模型,能够提供流畅自然的对话体验。
快意大模型在GitHub上已开源,允许来自全球的研究人员和开发者访问、使用和贡献代码,极大促进了大语言模型技术的共享与进步。
KuaiSim:推荐大模型
KuaiSim 是快手自研的一套综合性推荐系统模拟器,它通过模拟用户在多行为和跨会话场景下的反馈,为推荐系统模型提供了训练和评估的环境。
技术报告:
https://arxiv.org/abs/2309.12645
开源代码:
https://github.com/Applied-Machine-Learning-Lab/KuaiSim
其主要功能特性包括:
KuaiSim 通过细致地模拟用户对推荐内容的即时反馈、会话结束信号和用户留存时间,为推荐系统的研究和应用提供了一个强大的测试平台。
该模拟器能够支持三种不同层次的推荐任务:请求级别列表式推荐任务、整会话级别序贯推荐任务,以及跨会话级别留存优化任务。
KuaiSim 能够生成多行为的用户反馈,包括点击、点赞、转发、评论等,并且能够模拟用户在离开应用后的留存行为,这对于评估推荐系统的长期效果至关重要。KuaiSim 还提供了评估协议和基线推荐算法,为未来的研究提供了基准。
KuaiSim 的设计考虑了真实世界数据的一致性,使用日志数据来预训练用户响应模型,并在模拟过程中进行用户采样,这使得它能够灵活地适应不同的数据集。
KuaiSim 作为一个先进的推荐系统模拟器,不仅能够减少对真实世界数据的依赖,降低在线环境部署推荐模型的风险和成本,还能够帮助研究者和开发者在没有实时用户互动的情况下迭代改进推荐系统模型。
AI应用与创新
视频剪辑神器:快影
快影 是快手官方视频剪辑应用,它提供了一系列专业且易于使用的视频编辑工具。
官网:
https://www.kwaiying.com/
介绍:
https://h5.kwaiying.com/officialWebsite
快影的主要功能特性:
多功能剪辑:快影允许用户进行各种视频剪辑操作,包括剪切、合并、添加过渡效果等,满足不同视频编辑需求。
音频编辑:用户可以为视频添加背景音乐、音效,或者调整视频中的音频轨道,以提升视频的听觉体验。
字幕添加:快影提供了添加字幕的功能,用户可以轻松地为视频配上文字说明,增强信息传递效果。
特效应用:应用内置了丰富的视频特效和滤镜,用户可以根据个人喜好和视频内容选择适合的特效,让视频更具吸引力。
用户友好:快影的设计注重用户体验,即使是视频编辑新手也能快速上手,实现专业的视频制作效果。
专业效果:尽管操作简便,快影依然能够提供专业的视频编辑效果,满足高质量视频内容的制作需求。
快影作为一个智能化视频剪辑神器,以其专业而简单的操作界面,为用户提供了剪辑、音频、字幕和特效等全面的视频编辑解决方案,无论是初学者还是专业人士,都能通过快影轻松创作出高质量的视频作品。
AI虚拟伙伴:飞船(Kraft)
飞船(Kraft) 是快手推出的一款AI虚拟伙伴应用,它通过智能助手App的形式,为用户提供丰富而有趣的互动体验。
官网:
https://www.spaceshipapp.cn/
其核心功能包括:
自然语言对话:用户可以与App中的默认官方助手“领航员”进行自然的对话,获取各种信息、知识和灵感。
个性化AI虚拟角色:用户可以根据自己的喜好,创建和定制专属的AI虚拟角色,这些角色能够提供更加个性化的互动体验。
有趣、有料、有用的体验:飞船App旨在通过其AI技术,为用户提供既有趣又实用的交互,满足用户对信息和娱乐的需求。
飞船App利用先进的AI技术,为用户提供了一个可以进行自然对话、获取信息、并享受个性化定制服务的虚拟伙伴,使得用户能够在一个有趣的AI宇宙中探索和互动。
K歌社区:回森
回森 是快手推出的一款专注于K歌的社交应用,它为用户提供了一个共同享受音乐和唱歌的平台。
官网:
https://www.zhongnice.com/
其主要功能特点如下:
社交互动:回森聚集了许多热爱唱歌的用户,允许他们在这个平台上一起唱歌、交流,并通过音乐建立新的友谊。
丰富曲库:应用提供了大量流行歌曲,满足不同用户的唱歌需求,让用户可以根据自己的喜好选择歌曲进行演唱。
优质音效:回森提供了顶级的音效体验,让用户在唱歌时能够享受到高质量的音频效果,轻松成为麦霸。
展示才艺:该应用不仅允许用户展示自己的唱歌才艺,还提供了一个舞台,让用户的音乐才能得到更广泛的认可。
回森K歌APP为音乐爱好者提供了一个互动性强、音效出色的K歌平台,让他们可以在这里找到志同道合的朋友,共同享受音乐带来的乐趣。
潮流社区:噗叽
噗叽 是快手推出的一款潮流视频社区应用,旨在为年轻人提供一个分享和探索有趣内容的平台。
App下载:
https://apps.apple.com/cn/app/id1439077104
其主要功能特点如下:
丰富的内容选择:噗叽提供了多样化的视频和图文内容,涵盖年轻人感兴趣的吃喝玩乐、日常生活等主题,满足不同用户的兴趣爱好。
AI工具赋能创作:App内置了有趣的AI工具,用户可以利用这些工具将自己的宠物、朋友、恋人等作为创作素材,生成专属的表情包和动态图像,增加社交互动的乐趣。
互动性强的社区:噗叽鼓励用户之间的社交互动,通过点赞、评论、分享等方式参与内容的讨论和交流,虽然没有弹幕功能,但通过其他方式加强了用户间的联系。
多元包容的潮流文化:噗叽致力于打造一个新锐大胆的潮流社区,吸引对时尚、音乐、艺术或二次元感兴趣的用户,成为他们灵感和创意的源泉。
噗叽App的推出显示了快手在满足年轻用户群体需求方面的努力,通过提供丰富的内容和创新的AI工具,增强用户的创作能力和社交体验,打造一个充满活力的潮流视频社区。
摄影APP:一甜相机
一甜相机 是快手推出的一款多功能拍摄应用。
官网:
https://1tian.kuaishou.com/
其特点和功能如下:
风格独特:一甜相机的设计充满了少女心,为用户提供了一种甜美和时尚的拍摄体验。
多样化拍摄效果:该应用能够让用户拍摄出具有日韩风格的照片,满足用户对不同审美风格的需求。
Vlog制作:除了拍摄照片,一甜相机还支持Vlog视频的制作,让用户能够记录和分享自己的日常生活。
一键分享:用户可以轻松地将拍摄的照片或视频一键分享至快手短视频平台,便捷地与他人分享自己的生活动态。
易于体验:对于喜欢尝试新拍摄应用的用户,一甜相机提供了简单直观的操作界面,使得下载和体验变得非常容易。
一甜相机以其独特的设计风格、多样化智能化的拍摄功能、便捷的社交分享特性,为用户提供了一个既有趣又实用的拍摄工具。通过它用户可以轻松创作出具有个性化风格的内容,分享自己生活的点点滴滴。
创意生产工具:磁力快创
磁力快创 是快手提供的一站式创意智能生产平台,它通过整合海量的灵感资源和方法论来激发创意的萌生,并利用AI工具赋能创意制作。
官网:
https://cc.e.kuaishou.com/
平台的核心功能特点包括:
灵感与方法库:磁力快创汇聚了大量优质的广告资源,并提供真实广告效果数据。它为用户展示了各行业的最佳创意案例,提供了详尽的解析,帮助用户轻松获取灵感。
AI智能创作:平台利用人工智能技术,帮助用户在创意素材的制作上即刻掌握方法,使得创意生产有据可循,从而提高广告效果。
轻松高效投放:磁力快创不仅帮助用户激发创意和制作素材,还支持轻松高效的广告投放,使得广告的曝光量、点击率、转化率等关键指标得到优化。
海量素材和案例:平台提供了千万级的创意素材和优秀案例,使用户能够快速了解当前市场上的热门趋势和成功的广告策略。
数据驱动的创意:通过分析素材曝光量、点击率、转化率等关键数据,磁力快创帮助用户基于数据做出更精准的创意决策。
磁力快创通过这些功能特性,为广告创意制作和投放提供了一个全面、智能化的解决方案,使用户能够更加高效地创作和投放广告,从而提升广告效果和ROI。
快手AI开放平台
官网:
https://ai.kuaishou.com/
快手AI开放平台 是快手推出的一个综合性人工智能服务平台,致力于向广大开发者和企业提供领先的AI技术和解决方案。该平台的服务范围广泛,覆盖了包括计算机视觉、计算机图形学、自然语言处理、音频技术、视频技术、知识图谱、机器学习以及AR/VR/MR和多模态等在内的多个核心技术领域,满足不同行业和场景的需求。
智能创作平台
快手AI智能创作平台是一套以AI技术为基础的创新工具集,旨在全面升级内容生产和创作能力。
介绍:
https://ai.kuaishou.com/creation
平台的核心特点和优势:
AI技术赋能:平台通过集成先进的人工智能技术,如计算机视觉、自然语言处理、音频分析等,为内容创作者提供了强大的技术支持。
提升创作效率:利用AI能力,智能创作平台可以帮助用户快速生成和编辑内容,提高创作效率,降低生产成本。
丰富内容形式:平台支持多种内容形式的创作,包括文本、图片、音频和视频,满足不同类型创作者的需求。
个性化定制:AI技术的应用使得平台能够根据用户的需求和偏好,提供个性化的内容创作方案。
优化内容质量:通过AI算法的辅助,智能创作平台能够对内容进行智能优化,提升作品的专业性和吸引力。
便捷接入和使用:平台提供简单易用的接入方式,使得用户可以快速上手,将AI能力融入到自己的创作流程中。
智能创作平台通过这些特性,不仅为专业创作者提供了强大的创作工具,也使得普通用户能够轻松创作出高质量的内容,推动了内容产业的创新和发展。
AI图生图
AI图生图技术基于快手开发的先进扩散模型,能够实现从图到图的智能生成。
介绍:
https://ai.kuaishou.com/technology/AIGC/AIPainting
该技术不仅能够保持用户上传图片的内容,还能赋予图像全新的风格属性。AI图生图支持多种风格,如萌漫、次元漫画、新海城等,为用户提供丰富多样的视觉体验。AI图生图技术的优势在于其精美的效果生成、快速的响应速度以及风格种类的丰富多样。它能够刻画精致传神的图像,风格融合自然,且在行业中处于领先地位。此外,AI图生图技术能够快速生成不同风格的精美图片,目前已支持超过30种风格,并持续更新中,满足不同用户的需求。
在应用场景上,AI图生图技术可以广泛应用于营销活动。根据不同的营销需求,AI图生图技术可以为活动带来创新的视觉效果,提升用户的参与度和活动的吸引力。这项技术的应用不仅提升了内容的创意性,也为品牌营销提供了新的思路和工具。
人脸人体技术
快手AI开放平台提供了一套全面的人脸和人体技术解决方案,这些技术覆盖了从人脸关键点检测、人脸属性识别、表情识别到人脸对比、人脸光照估计以及人体关键点检测、手势识别和手部关键点检测等多个方面。具体产品服务包括:
人脸关键点检测
检测出图片中人脸关键点的位置,可同时检测最多8个人的101个人脸关键特征点位置,可应用于美颜拍摄,视频贴纸等场景
介绍:
https://ai.kuaishou.com/technology/Face/FaceDetect人脸属性
识别图片中多种人脸属性并输出数据,包括年龄、性别、眼镜、颜值、胡须、发型、脸型等维度。可应用于用户画像、广告投放等场景
介绍:
https://ai.kuaishou.com/technology/Face/FaceAttribute表情识别
支持识别多种表情,包括大笑、微笑、生气、委屈、眨眼、睁大眼、挑眉、皱眉、张嘴、嘟嘴、吐舌等
介绍:
https://ai.kuaishou.com/technology/Face/FaceExpression人脸对比
基于人脸特征信息,计算图片中两张人脸的相似程度,可应用于脸部特效、互动娱乐等场景
介绍:
https://ai.kuaishou.com/technology/Face/FaceCompare人脸光照估计
支持从图片中恢复整个空间的光照,适用于增强渲染真实感的应用,比如美妆动态减妆
介绍:
https://ai.kuaishou.com/technology/Face/IlluminationEstimation人体关键点检测
检测出图片中人体位置,可定位40个关键特征点,可应用于美型、人体特效等场景
介绍:
https://ai.kuaishou.com/technology/Body/BodyDetect手势识别
检测图像中出现的特定手势类型和位置,可支持17类不同的手势,如比心、恭喜、666、胜利、握拳等手势,可应用于手势特效、手势互动等场景
介绍:
https://ai.kuaishou.com/technology/Body/Gesture手部关键点检测
预测图片中任意手势的骨骼关键点位置,支持任意手势,每个手可预测21个关键点,包括1个手腕点,和20个手指关键点
介绍:
https://ai.kuaishou.com/technology/Body/Hand人体检测
预测图片中人体的位置和对应的概率值,支持多人检测
介绍:
https://ai.kuaishou.com/technology/Body/HumanDetection人像美化 SDK
支持跨平台人像美化功能,涵盖美颜、2D/3D美妆、滤镜、精细化面部重塑及五官、体态精准塑形多种美化效果,可灵活调节强度参数
介绍:
https://ai.kuaishou.com/technology/Gorgeous/GorgeousBeautifyAI原肤
去除人脸上的瑕疵,同时使得肤色更均匀、肤质更细腻,并且可以保持皮肤整体的真实感
介绍:
https://ai.kuaishou.com/technology/Gorgeous/DodgeAndBurn人像高清
针对人像图像,结合对抗生成前沿技术,去除模糊、噪声、压缩损失、清晰度不足等问题,得到高真实感高清画质人像
介绍:
https://ai.kuaishou.com/technology/Gorgeous/PortraitHD拯救人像废片
可将过曝、过暗、白茫茫、低动态等场景下拍摄的人像图像恢复正常,提升用户拍摄体验
介绍:
https://ai.kuaishou.com/technology/Gorgeous/SaveWastePortraits
图像智能处理
快手AI开放平台提供了多种图像智能处理技术,这些技术能够显著提升图像的视觉质量和用户体验。具体产品服务包括:
景深虚化
实时对单张RGB图像估测出图像中每个像素的深度信息,利用深度信息及人像分割实现人像景深虚化
介绍:
https://ai.kuaishou.com/technology/ImageProcess/Bokeh深度估计
通用场景深度估计,利用单张2D图片恢复出场景的3D深度信息,支持室内室外、人像、自然风景等场景
介绍:
https://ai.kuaishou.com/technology/ImageProcess/DepthEstimation人脸融合
对人脸图像和特定的人像模板进行融合处理,使生成的人像具有两张人像的外观特征,支持灵活配置融合区域、融合脸型及纹理相似度等
介绍:
https://ai.kuaishou.com/technology/ImageProcess/FaceMerge高清美颜
将带有人脸的图片进行高清美颜处理,具有人脸修复、人脸美颜、图像清晰化等效果
介绍:
https://ai.kuaishou.com/technology/ImageProcess/Beauty活照片
提取视频模板中人脸的表情和动作特征,从而驱动人脸照片做出相同的表情和动作,使静态照片动态化
介绍:
https://ai.kuaishou.com/technology/ImageProcess/LivePhoto弹幕防挡
通过人像语义分割技术,在视频中的弹幕区域叠加人像遮罩层,视频人物与弹幕和谐共存满足更高维度观看体验
介绍:
https://ai.kuaishou.com/technology/ImageProcess/BarrageBlocking3D Photo
估计图像深度,利用场景深度图、人脸深度图及手机陀螺仪参数等实现手机端2D照片的立体预览,支持人像、风景等多种场景
介绍:
https://ai.kuaishou.com/technology/ImageProcess/3dPhoto赛博朋克风格处理
识别目标场景并处理为极具未来科技感的赛博朋克效果
介绍:
https://ai.kuaishou.com/technology/ImageProcess/Cyberpunk
图像智能生成
快手AI开放平台在图像智能生成领域提供了多种创新技术,这些技术能够对图像进行深度的风格化处理,为用户带来丰富多样的图像生成和编辑体验,使得图像内容更加生动有趣。具体产品服务包括:
人脸属性编辑
对含有人脸的图像,进行风格化处理,可返回娃娃脸、变老、变胖等效果。可应用于特效、互动娱乐等场景
介绍:
https://ai.kuaishou.com/technology/ImageGeneration/AttributeEdit人像风格化
支持将人像处理为多种风格化图像,包括二次元漫画脸、手绘、童话等多种风格化
介绍:
https://ai.kuaishou.com/technology/ImageGeneration/StyleTransfer真实头发生长
精准识别图片中人像的头发区域,并利用生成式技术根据原有发型生成真实自然的长发效果
介绍:
https://ai.kuaishou.com/technology/ImageGeneration/HairGrowth表情套系
支持实时改变图片和视频中的人脸表情,目前已支持大笑、皱眉、嘟嘴以及多人的不同表情组合。可应用于社交互动、营销活动等场景
介绍:
https://ai.kuaishou.com/technology/ImageGeneration/EmojiSet浅色染发
精准识别图片中人像的头发区域,并利用生成式技术将头发区域处理为不同发色,可用于美颜相机、互动娱乐等场景
介绍:
https://ai.kuaishou.com/technology/ImageGeneration/LightColoredHair
图像分割抠图
快手AI开放平台提供了一系列的图像分割抠图技术,这些技术能够精准地识别和分割图像中的不同元素,其不仅在精度上表现出色,而且在稳定性和适配性上也具有优势,支持多种场景和全机型覆盖。具体产品服务包括:
人像分割
识别图像中人体轮廓,将其与背景进行分离,可应用于人体特效制作、图像处理等场景
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/PortraitSegment精细人像分割
对图像中人体轮廓进行发丝级的精细识别,将其与背景进行分离
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/PortraitMatting头发分割
高精度分割图像中人的头发,支持各种发型、发色精准分割
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/HairSegment天空分割
支持识别天空区域并进行精准分割,可应用于AR特效、图像处理等场景
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/SkySegment皮肤分割
针对人像可见皮肤区域进行精准分割
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/SkinSegment衣服分割
可准确分割出图像中人像衣服的边界,支持单人以及多人的衣服分割
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/ClothesSegment头部分割
可准确分割出图像中人像头部区域位置
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/HeadSegment手部分割
支持对图像中的手进行精准的语义分割
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/HandSegment指甲分割
支持对视频中人手的指甲进行分割,同时显示指甲的关键点信息
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/FingernailSegment人脸五官分割
对图像中人脸部位进行分割,支持16个五官部位的精细分割
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/FaceParsing人体解析
支持对图像中人体的各个部位进行分割,可精确分割20个身体部位
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/HumanParsing人像实例分割
支持对图像中的多个人像进行实例分割,精确区分实例数量。可应用于互动娱乐、图像处理等场景
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/InstanceSegment通用物体分割
识别输入场景中视觉中心的物体轮廓,并将其与背景进行分离,可用于图像批量处理、个性化创意等场景
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/GeneralSeg商品分割识别
输入图像中的商品轮廓,并将其与背景进行分离,可用于商品智能展示、广告创意等场景
介绍:
https://ai.kuaishou.com/technology/ImageSegmentation/CommonSeg
图像识别技术
快手AI开放平台提供的图像识别技术涵盖了广泛的应用场景,能够识别和分析图像中的多种对象和场景。这些技术包括场景及物体识别,能够识别室内外、人像、美食、动植物等100多个小类的对象,适用于图片内容分析和智能滤镜推荐等场景。具体产品服务包括:
场景及物体识别
识别图像中的通用场景和物体,支持包含室内外、人像、美食、动植物等27个大类,107个小类的场景物体识别,可应用于图片内容分析、智能滤镜等场景
介绍:
https://ai.kuaishou.com/technology/ImageRecognition/SceneAndObject猫脸检测
支持检测多个品种的猫脸,并输出75个猫脸关键点。可应用于宠物特效制作、互动娱乐等场景
介绍:
https://ai.kuaishou.com/technology/ImageRecognition/CatDetection狗脸检测
支持检测狗脸,并输出69个狗脸关键点。可应用于宠物特效制作、互动娱乐等场景
介绍:
https://ai.kuaishou.com/technology/ImageRecognition/DogDetection建筑检测
实时识别高楼建筑物的垂直平面并进行跟踪。可应用于营销娱乐、建筑特效等场景
介绍:
https://ai.kuaishou.com/technology/ImageRecognition/ArchitectureDetection植物识别
常见的绿植及花卉类别的检测,现阶段已支持306类常见的绿植及花卉的细粒度识别
介绍:
https://ai.kuaishou.com/technology/ImageRecognition/Plants
虚拟人技术
快手AI开放平台在虚拟人技术领域提供了一套全面的解决方案,涵盖了从3D卡通头像驱动到动作捕捉、实时虚拟形象驱动、虚拟人语音动画合成,以及PSD生成3D模型等多个方面。这些技术能够支持全身形象的实时驱动,捕捉并生成精细的表情和动作,使得虚拟形象能够精准匹配口型和面部表情,极大地丰富了虚拟形象的表现力和互动性。具体产品服务包括:
3D卡通头像驱动
animoji虚拟形象驱动,可支持全身形象驱动,支持各种精细表情及动作表达
介绍:
https://ai.kuaishou.com/technology/VirtualAvatar/Kmoji动作捕捉
上传人体图片或视频,即可获得动捕参数。结合待驱动的3D模型,生成渲染视频
介绍:
https://ai.kuaishou.com/technology/VirtualAvatar/MotionCapture实时虚拟形象驱动
通过单一摄像头进行实时捕捉,可驱动市面上主流Live2D&3D虚拟形象模型格式,秒变虚拟主播
介绍:
https://ai.kuaishou.com/technology/VirtualAvatar/3DTracking虚拟人语音动画合成
通过输入文本或语音,自动生成与音频相对应的3D虚拟形象视频,精准匹配口型和面部表情
介绍:
https://ai.kuaishou.com/technology/VirtualAvatar/VoiceToAnimationPSD生成3D模型
上传经过简单处理的原画psd文件,系统将其转化为对标Live2D的3D可动模型,并自动添加可支持动捕驱动的人形骨骼点
介绍:
https://ai.kuaishou.com/technology/VirtualAvatar/PsdTo3D
视频技术
快手AI开放平台提供了一系列视频技术,旨在增强视频内容的原创性、安全性、分类准确性和质量,这些技术共同为构建一个健康、有序的短视频生态系统提供了强有力的支持。具体产品服务包括:
视频原创保护
通过对重复视频的识别,以及对特定logo和台标的检测,识别搬运账号,降低搬运内容,打造原创社区生态
介绍:
https://ai.kuaishou.com/technology/ComputerVision/VideoOriginalityProtection文字识别
检测并识别图像或视频中的文字。通过定位画面中的文本区域,识别出对应文本的位置、文本内容以及文本属性信息等
介绍:
https://ai.kuaishou.com/technology/ComputerVision/OCR视频安全审核
采用计算机视觉、音频、NLP等多种人工智能技术,识别违反公序良俗的内容,提升审核效率,保障平台内容安全
介绍:
https://ai.kuaishou.com/technology/ComputerVision/VideoSecurityModeration视频分类与标签
利用视频分类、自监督学习、注意力机制、多模态融合等算法,精准识别视频层次化的类目与多维度的标签,广泛地应用于各场景中
介绍:
https://ai.kuaishou.com/technology/ComputerVision/VideoClassificationAndLabeling视频质量分析
通过提供质量分级和质量标签,结合内容的多维度信息及消费/生产数据等,对视频从多维度进行刻画
介绍:
https://ai.kuaishou.com/technology/ComputerVision/VideoQualityAnalysis
音频技术
快手AI开放平台提供的音频技术涵盖了语音识别、语音合成以及音频前端与分类处理等多个方面,这些技术共同为音频内容的创作、分析和优化提供了强大的支持。具体产品服务包括:
语音识别(ASR)
业界领先的语音识别能力,支持普通话、方言、英文、西班牙语、葡萄牙语、印尼语等多种语种
介绍:
https://ai.kuaishou.com/technology/AudioTech/SpeechTranscription语音合成(TTS)
将文本转换为自然流畅的语音,支持丰富的音色库,可支持灵活配置音频参数
介绍:
https://ai.kuaishou.com/technology/AudioTech/TextToSpeech音频前端与音频分类
对原始音频进行语音增强、降噪等处理,并识别音频中的声纹、语种、声学事件
介绍:
https://ai.kuaishou.com/technology/AudioTech/AudioClassification
NLP和知识图谱
快手AI开放平台在自然语言处理(NLP)领域提供了一套全面的工具和技术,涵盖了词法分析、评论分析和机器翻译等关键功能。在知识图谱方面,快手AI开放平台通过整合多元异构的数据源,包括海量的视频和文本数据,构建了多领域的知识图谱。这些技术极大地增强了信息的组织、检索和交互能力,为用户提供了更加丰富和精准的服务体验。具体产品服务包括:
词法分析
是自然语言处理基础模块,包含分词、词性标注、命名实体识别三大基础功能
介绍:
https://ai.kuaishou.com/technology/NaturalLanguageProcessing/LexicalAnalysis评论分析
对海量用户评论进行分析,识别评论中的情感倾向和关键信息,并评估评论的内容质量
介绍:
https://ai.kuaishou.com/technology/NaturalLanguageProcessing/CommentAnalysis机器翻译
利用机器学习技术,将文本从一种语言转换为另一种语言的能力。目前已支持10个语种共90个语向的互译
介绍:
https://ai.kuaishou.com/technology/NaturalLanguageProcessing/MachineTranslation知识图谱
基于多元异构的数据及快手海量的视频、文本等形态的数据,结合知识抽取、融合、构建和计算等能力,建设多领域知识图谱
介绍:
https://ai.kuaishou.com/technology/KnowledgeGraph/KnowledgeGraph
混合现实与智能特效
快手AI开放平台在混合现实(MR)和智能特效领域提供了多种创新技术,这些技术能够极大地丰富视频内容的互动性和观赏性。这些技术的应用场景广泛,从互动娱乐到视频特效,都能见到它们的身影,为内容创作者和用户提供了强大的工具,推动MR和智能特效技术在多个领域的应用和发展。具体产品服务包括:
地标AR特效
识别特定地标建筑物,并在建筑物上实时添加各种3D特效,如飞龙、花开、熊猫、涂鸦等
介绍:
https://ai.kuaishou.com/technology/MixedReality/Landmark天空AR特效
实时识别视频中的天空区域,并进行静态背景替换或展示AR特效,可应用于互动娱乐、视频特效等场景
介绍:
https://ai.kuaishou.com/technology/MixedReality/Sky地面AR特效
实时识别视频中的地面区域,并对该区域进行静态背景替换或展示AR特效,可应用于互动娱乐、视频特效等场景
介绍:
https://ai.kuaishou.com/technology/MixedReality/Ground虚拟打光
识别真实场景并对环境赋予特定的光照效果,可应用于互动娱乐、视频特效等场景
介绍:
https://ai.kuaishou.com/technology/MixedReality/Light万物AR
支持检测显著性物体(如水果、杯子等)生成立体的虚拟人物,并可以完成一定的动作,可应用于场景理解、AR人机交互等
介绍:
https://ai.kuaishou.com/technology/MixedReality/DetectSeg智能特效 SDK
基于自研的CV、CG、AR/VR等技术,支持短视频、直播拍摄场景生成2D/3D实时动态贴纸、游戏、自定义触发类特效效果,真实自然、
介绍:
https://ai.kuaishou.com/technology/Faceless/Faceless
智能互娱解决方案
快手的智能互娱解决方案涵盖了多个创新技术,旨在提升用户的互动体验和内容创作效率。这些技术共同推动了快手在智能互娱领域的创新与发展,为用户提供了更便捷、有趣的内容创作和互动体验。具体产品服务包括:
虚拟直播
支持Windows、Android和iOS系统上,2D/3D虚拟形象的用户定制、拼脸装扮和直播驱动
介绍:
https://ai.kuaishou.com/technology/Solution/VirtualLive虚拟演播助手
快手虚拟演播助手(KVS)提供虚拟人、虚拟场景、特效道具在内的一站式开播服务,支持互动玩法,提供沉浸式的直播互动体验
介绍:
https://ai.kuaishou.com/technology/Solution/VirtualStudio虚拟视频播报
提供集形象定制、情感语音合成、语音驱动表情等技术于一体的视频播报解决方案。仅需输入播报文稿,即可获得特定主播的播报视频
介绍:
https://ai.kuaishou.com/technology/Solution/VirtualBroadcast一键成片
提供丰富场景识别能力,根据人脸、人体、物体、环境等信息匹配最佳模版;支持客户端和服务端模版特效渲染,让视频制作更加简单
介绍:
https://ai.kuaishou.com/technology/Solution/InteligentVideoEditing
智能营销方案与互动屏
快手AI开放平台提供的智能营销解决方案融合了前沿的增强现实(AR)和人工智能技术,旨在通过创新的互动体验提升营销效果。互动显示屏则依托人脸识别、手势识别、美颜和3D特效等AI技术,打造了大屏实时互动体验,支持用户享受多种魔法特效和游戏互动,增强了线下活动的参与度和品牌吸引力。这些解决方案共同为品牌提供了多元化的营销工具,以吸引和互动消费者,提升品牌形象和销售转化。具体产品服务包括:
虚拟试妆
支持用户图片上妆与实时试妆,轻松上妆,高效试色,虚拟方式,真实效果,通过人脸关键点技术进行面部定位,实现虚拟造型服务
介绍:
https://ai.kuaishou.com/technology/Solution/MakeUpAR营销
运用AR、人脸、人体等技术,打造沉浸式虚拟商品互动体验;涵盖8大类品牌、效果玩法,为客户提供全流程新技术营销服务
介绍:
https://ai.kuaishou.com/technology/Solution/ARMarketing地标AR
基于LBS的AR服务,用户可通过摄像头扫描识别地标建筑物,建筑上会叠酷炫的AR特效,实现与地标建筑互动
介绍:
https://ai.kuaishou.com/technology/Solution/LandmarkAR互动显示屏
依托人脸识别、手势识别、美颜、3D特效等AI 技术,打造大屏实时互动解决方案。支持用户体验多种魔法特效和游戏互动
介绍:
https://ai.kuaishou.com/technology/Solution/IntelligentInteractive
总体而言,依托于快手强大的技术实力和丰富的业务场景,快手AI开放平台不仅提供了稳定可靠的服务,还确保了其技术的先进性和实用性。平台的算法和技术经过了广泛深入的业务场景验证,能够为客户提供高效、精准的AI解决方案。此外,快手AI开放平台支持多种接入方式,使得合作伙伴可以轻松地将这些前沿技术集成到自己的产品和服务中,从而推动业务的创新和增长。
快手云服务平台
直播开放平台
直播开放平台 是快手提供给主播和内容创作者的一项云端直播服务。
官网:
https://liveopen.kuaishou.com/
其核心功能和优势包括:
多种直播方式:支持推流直播和拉流直播,为用户提供了灵活的直播方式选择。
云导播功能:平台提供云导播功能,帮助用户更专业地管理和切换直播画面。
多平台分发:快手云直播支持将直播内容分发到多个平台,扩大直播的覆盖范围。
直播剪辑:提供直播剪辑功能,方便用户对直播内容进行后期处理和再创作。
广泛兼容:支持与OBS、无人机、运动相机、全景相机、编码器等多种软硬件设备的配合使用,提高了直播的兼容性和便捷性。
超高清直播:能够实现4K超高清和VR全景直播,提升直播画质和观众的观看体验。
智能识别精彩时刻:平台具备自动识别直播中的精彩时刻的功能,帮助创作者捕捉和保存重要瞬间。
丰富内容创作:快手直播开放平台使得创作者能够生产出场景丰富、玩法多样、内容多元的作品,增加了直播的吸引力和互动性。
快手直播开放平台为主播和创作者提供了一个功能全面、操作简便、且技术先进的直播解决方案,使他们能够轻松开展专业级的直播活动,为观众带来高质量的直播内容。
onvideo快手云剪
onvideo快手云剪 是快手官方推出的一款在线视频创作平台,它提供了一系列强大的视频编辑功能和丰富的素材库,旨在帮助各类用户,包括大型机构、企业和个人自媒体等,高效完成视频内容的制作。
官网:
https://onvideo.kuaishou.com/
平台的主要特点和功能:
视频编辑功能:onvideo快手云剪提供了在线视频编辑工具,用户可以直接在平台上进行视频剪辑、封面制作、去抖、抠像等编辑操作。
版权素材库:平台提供了海量的视频、图片、音频等版权素材,方便用户一站式剪辑和创作二创视频。
智能语音转字幕:利用智能技术,平台能够将视频中的语音转换成字幕,简化了视频字幕的添加过程。
智能字幕转语音:平台还支持将字幕转换成语音,为用户提供多种智能配音模板,轻松完成视频配音。
直播剪辑:支持边直播边剪辑的功能,用户可以实时发布直播中的精彩片段。
数据视频生成:提供动态数据模板,用户可以上传或在线修改数据,快速生成数据视频。
智能封面设计:平台调用智能算法推荐视频中的最佳画面作为封面,并提供丰富的文本模板,以生成高品质的封面图。
多分辨率输出:支持720P、1080P等多种分辨率的视频输出,满足不同平台的视频质量要求。
智能裁剪:支持智能裁剪算法,可以将横版视频一键转换为适合手机端观看的竖版视频。
团队协作:提供团队协同工作的功能,包括内容审核、媒资管理和资源共享,方便团队成员之间的协作和内容管理。
内容分发:视频制作完成后,用户可以一键将视频内容发布到快手平台,实现快速的内容分发。
onvideo快手云剪通过这些功能和特性,旨在降低视频制作的技术门槛,提高内容创作的效率,帮助用户快速制作并发布视频内容,满足不同类型用户在视频创作和分发方面的需求。
必扬特效开放平台
必扬特效平台(Beyond Effects) 是快手旗下一个专注于特效创作与分享的开放平台,其前身是快手特效开放平台(Kwai Studio)。
官网:
https://effect.kuaishou.com/
平台特点和提供的主要服务如下:
品牌升级:必扬特效平台在2021年4月完成了品牌升级,由原 Kwai Studio 更名为 Beyond Effects,旨在提供更专业、更先进的特效创作支持。
创作工具:平台提供了强大的特效创作工具 Beyond Effects,让不同技能水平的创作者都能轻松上手,释放创意潜力。
技术沉淀:平台利用图形图像处理和深度学习等技术,提供人脸、人体检测、关键点、分割等功能,将设计与现实结合,创造丰富的视觉特效。
特效类别:必扬特效平台支持多种特效类别,包括美萌贴纸、边框氛围、配饰装扮、美妆滤镜和体感游戏等。
魔法表情:必扬特效平台的特效在快手应用内以魔法表情的形式呈现,增强用户体验。
使用场景:制作出的特效可广泛应用于短视频内容拍摄、商业广告等,提供新颖的信息呈现方式。
用户支持:平台为创作者提供了现金激励、海量用户接触机会和专属曝光等福利,鼓励创作者发布和分享特效作品。
必扬特效平台致力于激发创意、创造流行,为快手社区内的亿万用户提供独特和有趣的视觉体验。通过这个平台,创作者可以将自己的艺术创作融入现实体验,成为一种新兴创作趋势的推动者。
视频云StreamLake
StreamLake 是快手提供的一套视频云服务平台,旨在帮助客户快速构建音视频及AI能力,并提供行业领先的用户体验,以支持业务的快速发展。
官网:
https://www.streamlake.com/
平台的主要功能和服务如下:
点播云服务:StreamLake 提供了集视频上传、存储、分发、播放于一体的精细化点播解决方案,同时包含视频分析、画质增强、内容理解等增值服务。
媒资管理:平台提供统一的媒体资产管理服务,涵盖媒资存储和信息管理。
媒体处理:拥有自研编解码算法和丰富的视频图像处理技术,包括音频处理、视频增强与修复、视频AI技术等。
智能分发:通过融合CDN的智能调度和分发能力,确保音视频内容的快速分发。
高性能播放:基于快手网络库、IP优选、预加载策略、高性能解码内核等技术,提供播放SDK。
视听体验升级:利用自适应智能媒体处理算法,全方位增强视觉和听觉体验,并优化播放器的消费体验。
运营成本优化:通过编解码、融合CDN/PCDN、热度触发等核心产品和策略,最大程度降低客户的运营成本。
场景化解决方案:为电商、广电传媒、泛娱乐等多个行业提供一站式的解决方案,满足不同场景的需求。
StreamLake 通过这些服务,为客户提供了一个全面、高效、且成本优化的视频云平台,助其在竞争激烈的市场中快速构建和扩展自己的音视频服务及AI业务。
异构计算与芯片业务
快手在2018年成立 异构计算与芯片事业部,是国内最早以“异构计算”为名的组织之一,提出以异构器件群来系统解决算力问题。
凌川科技官网:
https://transtreams.com/
经过6年发展,快手在异构计算和智能加速芯片领域已经取得了显著的进展。2024年10月,快手将该事业部及AI芯片业务正式分拆为独立公司 凌川科技,旨在深化其在AI芯片领域的技术积累和市场竞争力,专注于下一代AI大模型训推一体芯片的研发。
快手在异构计算与芯片领域的主要成就和布局情况:
产品与技术:快手自研的VPU和NPU芯片主要围绕视频在线转换和处理功能,后续可能加入辅助审核等功能。这些芯片紧密围绕快手的业务需求设计,虽然通用性不强,但对快手来说需求量巨大。
市场合作:凌川科技的智能视频处理芯片已经与多家互联网大厂达成合作或正在测试,显示出其产品的市场潜力和技术实力。据媒体透露,快手分拆时已有产品量产并在内部大规模使用,帮助集团显著节省了成本。
企业发展:团队从最初的30余名员工发展到100余人,目前正在进行VPU方面的融资工作、发展和扩张迅速。
行业地位:首款加速芯片SL200在MSU2022世界编码器大赛中荣获多项第一,并在2023全球数字经济大会中获得“数字经济创新引领成果”称号,凸显了其在行业中的领先地位。
快手在异构计算与芯片业务方面的发展表明了公司在AI芯片领域的深度布局和技术实力。通过分拆出凌川科技并独立运作,将为AI芯片市场带来了新的竞争力量。
快手AI总结与展望
快手已经构建了一套支持万亿参数大模型训练和推理的基础设施,并在此基础上研发出了行业领先的大模型矩阵。这些技术覆盖了内容生产、理解、推荐等多个层面,并深度服务于快手的内容服务和商业生态场景。
在内容生产方面,快手自研的视频生成大模型“可灵AI”已经累计服务了超过260万用户,生成了数千万的视频和图片,展现了其在深度内容创作上的巨大潜力。此外,快手AI还在不断探索新的业务场景和合作模式,如与OPPO联合推出的快手版AI手机,搭载了快手的AI特效、AI美颜、AI剪辑等功能,为用户提供了更好的拍摄和分享体验。
在商业化领域,快手AI通过提供全链路的解决方案,不仅提升了内容生产的效率,也增加了转化率。2024年上半年,有近2万商家在快手平台借助大模型能力实现智能化经营,其生成式AI的月活跃客户数、月GMV规模以及平台AIGC广告收入规模都实现了显著增长。快手还计划将可灵AI推向更多的B端合作,以实现更广泛的商业化变现。
随着技术的不断进步和应用场景的拓展,快手有望进一步升级其在短视频、直播等领域的AI应用体系,为用户带来更加个性化、智能化的体验。同时,快手AI技术的不断创新也将为其开拓更广泛的市场空间,包括电商、教育、娱乐等多个行业,实现多元化发展。此外,快手在全球化战略中也将借助AI技术的力量,更好地适应不同文化背景的市场需求,提升国际竞争力。
总之,快手在AI领域的持续投入和创新,加上其在直播电商、智能硬件等业务板块的全面布局,将有望成为引领行业发展的先锋力量,为用户和商业伙伴创造更多价值,同时也为企业自身开辟更广阔的发展空间。
附录
快手AI大事记
2015年
12月,快手成立第一支深度学习团队(DL组)并由李岩负责,主要任务是利用算法打击盗版和违规内容。
2016年
DL组更名为多媒体理解组(MMU),开始探索语音、文字、音乐等多种媒体形式。
郑文加入并成立Y-Lab实验室,专注于前沿算法研究。
2017年
快手完成3.5亿美元融资,用户和日活跃用户数显著增长。
MMU组快速扩张,引入顶尖人才进行算法优化和工程落地。
2018年
MMU组的算法开始进行融合,形成信息分发和人机交互两大业务体系。
快手正式推出营销平台加速商业化进程,包括快手广告和快手商业开放平台两大部分,强化自身“AI+大数据+社交”的定位。
Y-Lab实验室更名为Y-Tech,加强产品设计和工程化能力。
快手成立异构计算与芯片事业部,是国内最早以“异构计算”为名的组织之一,提出以异构器件群来系统解决算力问题。
2019年
快手首次在CVPR上展示了自研人脸特征识别的demo,引起广泛关注。
快手Y-tech研发的「端上实时人工智能平台」获得了2019年CCF科学技术奖。
快手上线AI开放平台,将过往积累的一系列AI技术和算法,如人脸识别、肢体识别、手势识别、人体分割、AR魔法表情等开放给开发者群体,让更多用户享受前沿科技带来的乐趣。
2020年
快手电商GMV超过3800亿元,同比超5倍增长。
快手发布电商直播运营白皮书,提出“STAGE直播运营方法论”。
2020年11月,快手公布了招股书,披露了其在AI领域持续高研发投入,也让重新让世人对其定位从短视频公司转变为高科技企业。
2021年
2021年2月,快手正式登陆港交所,成为“短视频第一股”。
9月,快手开启了十年来最大规模组织架构调整,将公司的整体架构从职能型转向事业部制,并明确了广告、电商、海外、游戏四大核心业务板块。
2021年底,快手联合OPPO推出快手版OPPO Reno6手机,搭载快手AI特效、AI美颜、AI剪辑等功能。
2022年
快手AI团队在国际顶级会议和期刊上已累计发表130+篇论文。
快手内部加大在生成式AI方面的技术投入和应用积累,包括大规模语言模型、多模态预训练、大模型智能创作工具等领域。
历时两年,快手自研首款智能加速卡SL200流片成功。
2023年
SL200在MSU世界编码器大赛获16项第一,并完成在快手数万颗大规模部署。
快手官宣自研大模型“快意”(KwaiYii)开启内测,并随后开源。
快手推出智能问答产品和快手AI对话功能。
2024年
快手发布图像生成大模型“可图”(Kwai-Kolors)并开源。
快手在7月初举办的世界人工智能大会期间举办大模型论坛,重磅发布“可灵”AI视频生成大模型等,可灵AI一经上线受到广泛关注和好评。
由可灵AI提供深度技术支持的国内首部AIGC原创奇幻短剧《山海奇镜之劈波斩浪》在7月份正式播出,播放量很快突破5000万。
截止2024年9月,可灵AI视频生成大模型实现显著突破,可灵AI累计服务超过260万用户,快手AIGC营销素材单日消耗峰值突破2000万。
2024年9月,快手科技2024年投资者日活动举办,公司高管团队介绍最新业务发展和战略目标,强调快手以用户为导向、以AI科技为驱动,优化内容、产品和流量体系,实现健康的高质量增长。
相关链接
快手中文官网:
https://ir.kuaishou.com/zh-hans快手英文官网:
https://www.kuaishou.com/en/快手AI开放平台:
https://ai.kuaishou.com/可灵大模型:
https://kling.kuaishou.com/可图大模型:
https://kolors.kuaishou.com/快意大模型:
https://kuaiyi-test.kuaishou.com/快手开放平台:
https://open.kuaishou.com/快手营销服务平台(磁力引擎):
https://e.kuaishou.com/
本文首发公众号:ADFeed。
自动驾驶之星和生成式AI与具身智能知识星球,新人优惠券来袭,结识一群志同道合的小伙伴一起成长。
下一个风口会不会是生成式AI 与具身智能的时代,我们特意创建了生成式AI与具身智能交流社区,关于大模型,机器人的相关业界动态,学术方向,技术解读等等都会在社区与大家交流,欢迎感兴趣的同学加入我们(备注具身智能)!
自动驾驶之星知识星球主打自动驾驶量产全技术栈学习,并包括: 学习板块,求职面试,有问必答,论文速递,行业动态五大板块!星球内部包括端到端大模型,VLM大模型,BEV 障碍物/车道线/Occ 等的学习资料!
生成式AI与具身智能知识星球,我们相信生成式AI 与具身智能会碰撞出出乎我们意料的内容,本知识形象并包括: 学习板块,求职面试,有问必答,论文速递,行业动态五大板块!星球内部包括生成式AI大模型,具身智能,业界资料整理等的学习资料!
👇点个“赞”和“在看”吧