让用户“找到”AI功能比实现功能更重要

教育   2024-12-07 15:01   河南  

 图源:Unsplash  


“ 越来越无所不能、智能程度快速提升的基座大模型及衍生的AI应用面临一个尴尬的问题,用户非常认同‘AI很强大’,但使用频率低。”


这并不是因为大模型适用场景少,恰恰相反,大模型的应用场景包罗万象。但与任何一个时代一样,高频、高价值、刚需的需求永远是少数,已经完全渗透到每个人生活当中的移动互联网和智能手机,霸占首屏的超级App也不会超过20个。


我们的一个观点,大模型独特的多模态内容生成能力,能够覆盖的应用场景远超以往,但为了满足用户高度个性化的需求,让用户“找到”对的AI功能与实现功能同样重要


1. 如何评价一个AI应用是否有用


我们经常看到两类观点:


观点一:“OpenAI最新o1-preview模型在美国数学邀请赛(AIME)表现使 o1 跻身全美前 500 名优秀学生行列,在物理、化学和生物学领域的复杂基准测试,表现堪比博士生。”


观点二:“ChatGPT就像是你聘请了一个大学刚毕业月薪8000块的助理”。不过你不会真的每个月付给OpenAI(或任何一个大模型厂商)8000块,ChatGPT付费账号每月20美元,约为人民币140元。


堪比博士生水平的o1-preview大模型测试结果


究其原因,大模型及衍生AI应用的智能程度取决于多大程度上用户在使用时恰好“撞上”了用户需求。以我目前创业方向AI生成英语课件PPT这一场景为例,如果用户直接使用OpenAI最新的o1-preview模型去生成课件内容,用户满意度可能是80分,也可能是40分。





无论是因为用户没有那么熟悉prompt、大模型的非稳态输出特性(这一问题在频繁使用情况下尤为关键,下文另述)、多模态能力的欠缺,1%的情况下大模型的输出正好撞上了用户需求,80分;99%的情况下没撞上,40分。


由于大模型缺乏对context——即用户需求——的准确理解,大模型给用户交付的最终结果是(80+40)=平均60分。因此在日常使用大模型过程中,用户的体验更接近于“ChatGPT就像你请了一个大学刚毕业月薪8000元的助理”


2. 基于LUI构建的AI应用效率极低


当下大模型及衍生AI应用的主流交互方式是一个对话框,用户输入一段、大模型回一段。


一种效率极低的交互方式


并不是因为用户掌握prompt很难——绝不会比你上学时学习三角函数更难——但和学习三角函数有一个很大的共通性,你不常用;99.9%的人中学毕业后因为不再做数学题,所以永远忘记了三角函数是怎么回事儿。


具体分析有三层原因:


第一,说清楚需求本身就不容易


即便不考虑输入Prompt的一些技巧性因素,人与人沟通都很难。


再深入一层,核心问题还是脖子后面没有插电,大模型无法实时准确理解用户需求。寄期望于用户把手机、电脑中的数据与大模型同步后大模型给到反馈更是短期无望。即便不考虑成本问题(把电脑/手机中几百个G的数据传到大模型)、隐私问题、速度问题,单个用户数据都是无效数据。因为存储的数据都是结果而非过程,而说清楚需求——比如用写Prompt的方式——是和大模型表达自己的思考过程。



第二,为每个垂直需求写prompt极耗精力


并不是说垂直需求不值得被解决,而是满足垂直需求有成本。还是以生成英语课件PPT为例,我们现在告诉大模型一个更详细的需求。


换言之,用户此时部分承担了一部分互联网产品经理的角色,但大模型又不给用户发工资(好处是不会被同事/用户怼反而可以怼大模型)。



第三,最大的问题在于,使用频率过低


用户写了一个基于垂直场景的Prompt,可以存到GPTs里,也可以封装一个豆包的智能体,甚至是存到电脑上的记事本也可以。但问题在于这个需求对用户自身而言非常低频,可能一个月才用一次,甚至一年用一次。


用户可以创建无数个智能体,但使用频率极低。


在大模型时代,大量低频垂直需求覆盖99%场景


大量的用户需要大量的AI应用/智能体/或者说一个功能去提升自己的工作、学习、生活效率,大模型确实也能做到,但到每个具体功能,一个月可能只用一次。


3. 有没有更高效满足用户大量但低频需求的方式?


AI应用所解决的问题很像大规模因材施教。


  • 一个老师要面对大量的学生(大量)

  • 每个学生的需求高度个性化(个性化)

  • 但是每次课程或辅导,上完也就完了(低频)


再教类似的内容只能等到下次——如果是公立学校,这个周期可能是第二年,且学生的需求又会发生一些变化。


4. 第一步—封装高质量、高度稳定的AI应用


用户当然还是需要好的AI应用,不单单是内容本身,包括结构化的输出的能力、多模态的体验、便捷或创新的交互体验等等。一个简单例子,如果非要逼迫用户说清楚你到底想要一个什么样的游戏,用户只能苍白回答想要个“好玩的且免费”。


回到生产力、效率工具层面,高度稳定的结构化输出至为重要。这就像是在公司工作,虽然老板也偶尔需要员工头脑风暴、给些新的input,但大多数情况下还是需要我说什么你干什么,擦桌子就擦桌子、扫地就扫地,不要自由发挥。


而基座大模型的发展趋势还是在于提升智能程度,给到质量越高、更加创新的“好点子”,但稳定的使用体验仍然需要应用公司来交付。


在我们的产品中,我们对每个教学模块都做了深度开发,让AI生成的内容不是一次好,而是次次好。


很受欢迎的词汇和AI阅读,稳定输出是关键


5. 第二步—让用户“找到”对的AI应用


打开Product Hunt,我们能在上面找到上万个创新的AI应用,如果你搜索的时间足够长,你大概率能找到一个恰好满足你当下需求的一个应用(至少其中的某个功能)。但成本在于“找到”的时间很久而你又一个月只用一次,“找到”应用的时间已经远超过手工完成这项任务的时间。


打开Product Hunt,全球最大的创新应用分享平台,我们能在上面找到上万个创新的AI应用,如果你搜索的时间足够长,你大概率能找到一个恰好满足你当下需求的一个应用(至少其中的某个功能)。但成本在于“找到”的时间很久而你又一个月只用一次,“找到”应用的时间已经远超过手工完成这项任务的时间。


Product Hunt,全球最大的创新应用分享平台


6. 对垂直场景的覆盖


功能可能是低频的,但场景是高频的。目前我们的产品注册率高达28%,基本上每个有生成英语课件需求且找到我们的用户都会尝试我们的产品。 



7. 交互的价值被大幅低估


我们认为帮助用户快速“找到”对的AI应用/功能至关重要,不但是因为当我们打开一个空白的Word或PPT界面,压迫性极强的空虚感扑面而来。


而是符合专业用户认知的功能分类与搜索能大幅提高效率,以英语教学为例,老师今天是想教词汇、讲语法、阅读理解、生成一个有趣的课堂游戏或是满足学生应试备考的需求,都有一个明确判断,产品要能够帮助用户快速找到自己所需的功能。



8. 充分满足用户个性化需求


不同的学习阶段、老师的教学目标、所依赖的教学标准、运用的教学方法各有不同,AI所生成的课件内容但凡有一项不符合用户期待,下一次使用的可能性都会变得很低。


目前我们的产品覆盖从Pre A1到B1的教学需求 


此外,结构化的输出设置当下还是不可或缺。工具的本质是服务于人,但由于AI对于具体用户个性化需求理解的不能,还是需要人对最终生成的内容把关,这既包括支持用户调整和修改具体课件PPT的文字内容,也包括对音视频多模态内容和整体审美风格的预览和选择。 


提供包括PPT内容、音频和模板风格的选择


在我们的产品中,我们会为老师提供课件PPT内容的段落划分与修改、对应的音频选择,以及后续会有歌曲和视频设置,在尽可能不影响效率的前提下满足用户个性化需求。


欢迎感兴趣的朋友体验我们的产品,mayippt.com

与我联系,我们会为部分早期用户提供会员兑换码 



芥末堆
作为教育行业11年观察者,掌握政策与趋势讯息,分享当下教育行业中科技的深入运用,以及衍生机遇例如农业和银发领域。
 最新文章