儿歌点点携手火山引擎,共创儿童成长AI伙伴

科技   2024-11-15 15:30   北京  

随着人工智能时代的到来,儿歌点点正积极致力于探索 AI 技术与儿童启蒙的融合之道,旨在为孩子们提供更加个性化且丰富的内容资源以及更加多元有趣的互动体验。

儿歌点点(萌宝旗下产品),是国内领先的幼儿娱乐启蒙音视频内容平台,提供包括 10W+ 集知名儿歌、动画片、故事、绘本等内容。该 App 已超过 3.5 亿次下载量,月覆盖 1,300 万中国家庭,持续创作推出不同类型的启蒙内容。

图片及内容来源于萌宝官网
1 与动画明星互动聊天,AI 伙伴陪孩子一起进步

孩子在 2 至 6 岁的成长阶段尤为关键,他们的需求多样,涉及身心健康、语言发展、社交互动、科学探索以及艺术创造这五大核心领域。这一时期,孩子们对世界充满好奇心与丰富的想象力,喜欢提出有趣的问题和创造故事。对于家长们而言,确保孩子们所接触的内容既安全又适宜,无疑是他们最为关心的问题,同时也期望能够以一种既轻松又科学的方式,陪伴孩子共同成长,满足他们在各个成长领域的探索与学习需求。

为了响应家长和孩子们的这一共同需求,儿歌点点近期推出的 AI 伙伴功能,精心打造了孩子们喜爱的动画角色 AI 伙伴,包括点点猴、李白、孙悟空、Lucy 老师等多样化形象。这些 AI 伙伴能够与孩子们进行实时互动,聆听心声,解答各种问题,以他们易于理解的方式探讨和分享他们感兴趣的话题,从而在不知不觉中引导他们养成好习惯,培养良好品格,增强安全意识,提升语言表达能力,增强社交互动技巧,并激发他们的创造力和想象力。

儿歌点点 AI 伙伴

2 两周上线 AI 伙伴功能,一站式方案让创新加速落地

儿歌点点始终致力于将先进的 AI 技术融入其成长与交互场景中,提供更智能的互动体验。然而,在早期的 AI 技术探索实践中,儿歌点点团队发现,要确保模型生成内容的绝对安全和细节调优、AI 对话服务的高可用性和资源灵活调度以及互动低延迟性,每一项都是艰巨的挑战,需要投入大量的精力和资源。

为解决这些挑战,儿歌点点采用了火山引擎的一站式对话式 AI 实时交互方案,方案整合豆包大模型、语音识别和语音合成等 AI 技术,并通过火山引擎 RTC 技术高效处理语音数据的采集与传输,快速实现智能对话功能。在开发阶段,儿歌点点无需考虑 AI 技术整合编排的复杂性问题,能更专注于大模型的调试和角色打磨,因此仅用两周时间就成功上线了「AI 伙伴」功能。

3 流畅、自然、有趣,打造符合儿童的 AI 互动体验

在 AI 的互动体验中,孩子们展现出与成人截然不同的特点,如语速较慢,表达常常不连贯,且一旦对话被打断,往往就不愿再继续交流。鉴于这些特点,儿歌点点联合火山引擎 RTC 团队,特别对 AI 响应延时、实时打断速度以及音色还原等方面进行深入优化,确保能完美贴合孩子的对话习惯和趣味性,从而创造一个更加友好和鼓励性的交流环境。

超低延时,流畅交流

通过火山引擎 RTC 实现超低时延视频传输和云端音频流式处理,并对 AI 语音能力的全链路进行优化(RTC-ASR-LLM-TTS),从而将声音采集到 AI 响应回复的时延大幅缩减,最低可至 1s。确保孩子们在与 AI 对话时,能够享受到更为流畅的交流体验,不会再因为等待回答而感到沮丧。

实时打断,自然互动

火山引擎 RTC 客户端的 AI 降噪功能能有效消除环境中的噪音,避免对 AI 伙伴回复的误打断。同时,服务端毫秒级人声检测和语音识别深度配合,能在实时捕捉孩子发言的同时,又能适应其说话中的自然停顿,实现打断灵敏与断句准确的平衡。孩子可以随时打断 AI 伙伴并提出新问题或想法,而 AI 伙伴则能迅速、流畅地切换话题,给予实时反馈。

真实音色,温暖陪伴

通过火山语音合成技术,赋予 AI 伙伴以孩子熟悉的动画明星声音,并且火山引擎 RTC 所支持 48kHz 全频带音频编码传输,确保播放时保留所有声音细节,高度还原角色声音。这样的音色不仅能够吸引孩子们的注意力,还能让他们感觉到更加舒适和安心,就像与一个真正的朋友在交谈。

与 AI 伙伴语音通话效果

在 AI 领域的探索中,我们发现大模型正逐步展现出在儿童启蒙领域不可小觑的潜力与价值。我们将与火山引擎深度合作,充分借助大模型与实时音视频等技术,不断为儿童创造新奇玩法,将启蒙内容与趣味形式融合,为孩子们打造一个既安全又充满无限可能的学习与娱乐环境。

屈晓龙
儿歌点点 AI 伙伴负责人

未来,火山引擎进一步强化对话式 AI 在儿童陪伴等领域的应用,以技术推动互动体验升级,携手更多企业共同为孩子们构建一个更加丰富多彩、寓教于乐的成长天地。

InfoQ
为一线互联网公司核心技术人员提供优质内容。科技圈的观察者,前沿技术的传播者。
 最新文章