即构科技:AI+实时互动 探索泛娱乐出海新思路

财富   2024-12-14 12:00   北京  
12月5日,由全球化媒体智库——霞光社ShineGlobal&霞光智库举办的WAVE2024全球领航者大会在深圳举办。
本次大会以“点亮·全球”为主题,并开设“中国互联网,出海做爆款”泛互科技行业分论坛,聚焦展现泛互科技行业在全球市场的新动向和增长机遇。
在数字化浪潮和全球化趋势的推动下,泛娱乐行业正迎来前所未有的发展浪潮。即构科技作为实时音视频技术的领先企业,其市场总监邢紫月以“AI+实时互动,探索泛娱乐出海新思路”为主题,发表了精彩的演讲。
以下为演讲原文,经霞光社整理发布。

在2015年即构创业时,就选定了实时音视频的赛道,当时的创始团队做过QQ的实时音视频的后台,我们希望这个技术能够被更多的人去使用。2015年当时正好也是国内的直播产品大量涌现的时候,所以我们的技术也被用于很多社交的产品:直播、语音视频聊天、在线KTV等不同的场景,支撑了很多APP成为国民应用。在国内迅猛发展的时候,在2016年就有很多客户已经开始出海了,伴随着客户的出海,即构也开启了自己的出海旅程。
我们的产品矩阵也是跟着客户的业务发展而一起发展的。即构涉足的行业还是很多的,我们主要讲这张图的泛娱乐产品方案,以及去年上新的链接伙伴的云市场。我们最核心的产品是实时语音和实时音视频,最开始是做直播的连麦,延伸到后面的语聊、一对一的视频场景。随着泛娱乐客户对直播的质量和画质清晰度的提升要求,我们也打造了一套超低延时的直播产品和即时通信的产品。这是我们重要的基础能力。之后还有不同的行业解决方案。
即构从出海的时候,配合客户的出海做了很多技术上的优化和多云厂商网络的融合。从地理的选择上来看,东南亚是很多泛娱乐客户出海的第一站。今年我们可以观察到社交类的应用在东南亚国家,比如马来西亚、泰国、菲律宾的下载量都是超过了50%的。这两年中东、海湾六国大家也去得挺多的,已经很卷了。北美和拉美地区还是少数头部玩家的涉足区域。短剧在北美的发展还挺迅速的。从业务层面上来说,泛娱乐主要还是几个场景:一对一的视频、语聊房、直播
这两年大家都在谈AI,AI带来的变革正在全面铺开。比如中国的开发者正在进入娱乐、生产力工具、教育AI等很多应用。根据点点数据中国非游厂商的出海收入榜来看,有一家叫作睿琪软件的公司,已经连续多月都在领跑榜单的前三。他们的核心产品叫作PictureThis,它是做直播识别的产品,这个小众赛道带来的营收非常可观,已经创造了超过30亿的预估收入。它不仅可以做植物的诊断,还会给出一些养护的建议,这就能满足很多欧美的需求。
另外是AI陪伴软件,这也成为泛娱乐行业的风口,像Talkie现在的下载量已经超过了2000万,从最近的数据来看也一直是在增长的。
在泛娱乐行业,出海已经成为行业共识了。即构大部分的客户都是做泛娱乐的,我们看到2024年的实时音视频的大盘流量中,海外的流量已经超过了国内。伴随着新一轮AI出海的浪潮,如果大家需要找实时音视频的伙伴,可以来找即构。

接下来我将进一步分享在即构视角下的三个比较成熟的业务场景以及一个和AI结合的新场景。
首先是1V1视频,1V1视频是最近增长迅猛的细分领域之一。今年三季度,1V1视频的在投数量同比增长了86%,特别是在中东、东南亚、北美的市场。这个业务模式其实是比较简单的,但买量是很贵的,怎么样把买量过来的流量进行转化呢?总结路径包括四个:匹配、接单、交易、结算因此,提升每个阶段的转化率都是非常关键的。尤其是视频的接通率,它直接关系到转化漏斗的开口率有多大。
像从印度头部客户看到的情况来看,如果超过2秒还没有接通的情况下,基本都会挂断。卡顿率也是非常重要的一个指标。在解决卡顿率方面,即构也是做了很多底层的工作。即构和客户一起共创,能够实现秒开的方案,使得2秒内的接通率从行业常态的70%提升到了95%。比如按1000万的流水计算的话,假设接通率提升25%,它的营收大概可以提升250万。
此外,从去年开始,大家上架应用商店难、审核难,这成为开发者的普遍问题。我们给到客户的建议是运营H5端,这样可以规避应用商店的三大问题。我们也推出了带UI的方案,一个星期就可以帮助客户的业务上线,尤其是带UI的视频通话方案在海外特别好,很多纯海外的客户比较喜欢UI通话方案。我们有高精度的计费方案,可以降低费用投诉率。
语聊房场景比较成熟,但语聊房在每个地区的发展情况是不一样的。不管在哪个地区、哪种模式,语聊房的内容生态都是这个业务能否成功的关键:如何让主播能带着大家玩起来,让用户之间能够破冰。即构是一家技术服务商,一方面,我们提升语聊最基础的体验,包括音质和流畅度;另外也能给客户更多的扩展玩法和技术方案,帮助用户增加停留时长。
语聊房场景会有一些痛点问题。如果身处嘈杂环境的用户加入语聊的话,他一开麦的时候整个房间的体验都不太好。这种情况在海外是更加常见的,尤其像东南亚、印度这些地方。现在有很多用户之间会手机外放声音,这在语聊场景中也是非常普遍的。在海外很多地区一上麦用户外放的选择率高达70%。用户对于音质的要求也是越来越高的,上半年针对音质问题的反馈占到问题反馈的11%。
针对这些问题,我们推出了Purio AI音频引擎。2015年创业的时候即构就发布了第一代音频引擎,从底层技术开始就满足了客户各种需求。2022年做了一些优化,今年推出了全新一代的Purio AI音频引擎,它升级了几个AI的算法,包括AI降噪的算法,还有AI回声消除的算法以及动态响度均衡的算法。总的来说,就是让人们在实时语音的过程中体验能够更纯净、更保真、更舒适。
基于Purio AI音频引擎,对语聊房、唱歌、小游戏的玩法相结合,能帮助提升音质,从而增加用户的在房时长。
重点讲一下在线K歌,怎么样促进上麦率呢?一方面,即构的算法可以提升在线K歌的体验,比如外放音质、伴奏和人声对齐;另一方面,我们也解决了版权的问题,现在海外支持多语种曲库资源达到10万首,StarMaker也用了即构的方案。
针对在线KTV的场景,我们推出K歌专用音效,实现0毫秒的误差,精准对齐人声和伴奏,超低耳的延迟可以做到平均40ms。对于用户的美声、变声的个性化需求,Purio AI音频引擎也可以支撑。现在国内的六间房也用了即构的变声玩法。
直播发展到现在相对成熟,竞争非常激烈,本地化的内容生态尤其是主播对于直播的业务是非常关键的,如果直播的画质模糊,对效果的影响会非常大。即构从弱网、延迟、同步性、靠卡顿率等多个维度支撑,保障大主播的视频质量。
针对高质量直播客户的需求,即构打造了一个超低延迟直播的产品,简称L3。L3具备超低延迟、超清画质、超低卡顿的特点,延迟最低可以达到600ms到1000ms。目前几乎所有的头部直播产品都在强调超清画质,并且还要控制住成本,所以特别适合L3这个产品。一个头部客户在使用L3之后,它的人均观看时长提升了超过6%,付费用户增长了超过2%。
合规对出海的业务也特别重要,业务的本地化程度能够决定我们的上限,但满足合规政策就是我们的生命线。每个地区都有自己的一套法律法规和执法标准,怎么样理解专门的条款,并且把风险降到最低呢?一方面,即构自己也做了国际业务,跟很多外部机构有合作;另一方面即构也和合作伙伴一起,通过解决方案给大家分享一些经验。
在内容审核层面,即构和合作伙伴搭建了一套全面的接入体系,可以覆盖从音视频互动、即时通信、信息流等全场景,适配业务审核了解,满足业务合规实施的手段。

AI带来变革的同时也带来了新的机遇,现在已经有一批AIGC的泛娱乐应用在市场上赚到钱了。即构作为服务商,我们也推出了AI Agent的解决方案。AI Agent的模式是人和AI的互动,与人和人的互动没有本质的区别,都是用到各种信息的传输。对于大语言模型来说,初期形态是以文本交互为核心的,在应用上落地也是以即时通信为载体,比如AI回复文本,再结合一些文生图的能力。今年GPT4.0发布之后,文生图模式也成为了趋势,通过RCT形式把语音传给AI,这也是很自然发生的事情。
AI陪伴已经成为泛娱乐领域新的分类。根据8月份最新的报告,在Top50 AI应用榜单中,16%的产品是AI陪伴类的产品。现实中,我们接触了很多新老客户,已经在往这个方向探索了。大概有两种模式,一种是带有情绪或者剧情主线的AI人设陪聊,从满足特定人群的情绪价值中挖掘商业机会。另外一种是主播分身,也就是数字人。
即构AI Agent的全套方案能力,通过接入SDK以及服务端的API,两周内可以帮助客户实现用户与AI进行文字、语音互动通话的能力,可以满足AI陪伴、AI客服、AI数字人的场景。这套方案最大特点就是灵活可扩展,支持文字、语音多模态的AI实时互动,并能随时打断,就像人可以随时打断AI的说话内容,AI也可以打断人,就像你和真人互动一样。
在延迟方面,也可以做到最低1秒左右,对比一些海外C端产品的延迟表现也达到了前列。结合Purio AI的音频能力,我们上线了回声消除和降噪的效果。方案还具备智能体的模板库,支持AI调整工作流,用户可以创建自己的智能体,定义性格、人设,具备了会话管理、记忆模块等功能。
祝大家在即将到来的2025年,都能做出爆款出海产品,出海掘金找即构!

霞光社
赋能企业全球化
 最新文章