什么是AI语料?
一个问题+一个回答=一条语料吗?
是不是就是像给人写回信一样?
人情味儿?就是写得温情点?有具体标准吗?
长度多少合适?
这些问题都是AI向善语料库在共创过程中经常被问到的,截至到目前,在第一期共创伙伴组织的大力支持下,已经收集了数千条老年人日常生活中的真实问题,问题的收集以“广”为主,既有共性问题,又有个性问题,小到情绪波动、网络购物,大到心理危机、临终关怀、方方面面都要涉及到。
那我们现在就进行到了,写“答案”的环节。回答的填写不再是追求“数量”的多,而是更关注质量,更看重答案是否能够真正符合老人的需求。语料库之于大模型,好比教科书之于学生,共读会相当于一场“编委会”,我们在共读会上一起讨论“教材”的编写标准,推动语料库的高质量建设。
10月31日,我们发出了一条推文《最最最动人的不是文字,是素未谋面的爱与善意》用以招募第二期的共创伙伴,为专业版的AI向善语料库提供高质量且有人情味的回答。在推送发出之后就得到了几十个社会组织的积极响应,近期我们邀请到了其中七个共创团队的成员作为第二期共创组织的代表来到了今天的共读会上。
为了获取更多元且更专业的“好语料”标准,本次共读会邀请了来自三位大模型专家,以及多位不同身份的共创组织代表,他们有的是社工,有的是医生,有的来自志愿者组织,也有来自高校的教师。各位嘉宾分别从自身背景与实际经验出发,就“何为向善语料的标准”展开分享和讨论。
各抒己见:同一问题有不同答案
我们事先向所有参会嘉宾征集了针对以上问题的回答,并邀请了六位参会嘉宾分享了他们的答案,以及他们在撰写答案过程中的考量。
大模型技术专家Henry首先指出,准确性和无偏性是向善语料的基础属性。所以在回答以上问题时,他认为回答者需要准确识别老人的情绪,充分理解他们的真实问题,并站在老人的角度去思考问题,他认为这位老奶奶当前面临着从熟悉环境切换到陌生环境的无所适从的局面,身边可以提供陪伴的孙女由于学业压力无法给到及时的情绪支持,从而让她感到十分孤独。在精准识别老人情绪后,需要给到一些切实可行的建议,针对老奶奶比较内向的特定,Henry特别建议可以让她通过上网与远方的亲友建立联系。除了对答案内容提出建议外,Henry认为答案需要更短些,且避免过多专业术语的堆叠,这将有利于老年人的理解。
来自吉林省老年福祉研究会的姜锐副会长则从专业社工理论视角分享了见解。首先对问题进行了情境分析,这位老奶奶常年处于无人说话、聊天,没有倾诉对象,也没有兴趣爱好,亲情社会交往严重缺失的状态,这使得她感觉自己像是身处于一座孤岛中,从而出现孤独无助、恐惧抑郁等一系列负面情绪,这将严重影响老人的心理健康。此时她最需要的是来自他人的热情问候和关心,是来自环境的可感知的温暖。在识别老年人的问题后,利用生态系统理论指导建议撰写,通过积极鼓励老人与周边环境互动,如前往附近商超、公园、参与社区活动,以及积极寻求与家人的沟通交流等方式来改善自身孤独感。
相比起姜副会长是以一名专业社工的身份来分析与回答问题,另一位大模型技术专家Roland则是为大模型的回复设定了一个基本流程,他希望大模型能够从倾听、理解、共情、建议四个环节给予老人回复。其中在人机交互的过程中,问题文本的输入就等于大模型倾听了用户的想法,所以大模型给到的回复则更加注重理解、共情和建议提供的部分。当然随着技术的发展,用户能够使用实时语音交互与大模型进行沟通,那么大模型对于用户的情绪感知将会更为敏锐,更接近于现实生活中人类的倾听过程。
来自深圳市龙岗区彩虹社会工作服务中心的石圆圆副总干事将自己的答案划分为三段,前两个部分可统称为同理阶段,她首先简单描述了老人的处境:这位老奶奶处于一个陌生环境中,感到孤单无聊,并在此基础上,进一步感知她的需求和顾虑——她渴望在新的环境里交到新朋友,参加活动丰富自身生活,但又担心自己放不开。石副总干事认为这是答案中必须包含的部分,只有精准识别老人的真实情况,才可以进入答案的第三阶段——“对症下药”,给到建议。
积极老去小组主理人星星给出了与彩虹社工的石副总干事相似的回答逻辑,同样都是在充分倾听理解的基础上给到老人回应,值得注意的是,星星认为激发老人内在积极性对于问题解决很重要,她在答案文本中增加了首先、其次等表示顺序的词汇,她表示她更想鼓励老年人从自己的角度去寻求一些解决方案,所以她将一些老人能够独立完成的行动作为首要的建议,然后才是向身边的家人或朋友寻求帮助;最后再次修复老人的信心,告诉她这是一个普遍问题,无需对此感到焦虑。
来自喜见语料团队的周波波女士,则提供了全新的看法。她认为在很多情况下,老年人更多只需要一个情绪发泄的出口,她并不需要获得确切的解决方案,所以在回答过程中,周女士选择绕开老人孤独焦虑的情绪表达,另辟蹊径,就这位老奶奶的孙女正在上高中,老奶奶还能陪读的事实表达祝贺,一下子将答案的主基调从关注老人的孤独引导至努力发掘老年人积极情绪中,同时周女士巧妙地以照顾孙女为切入点,让这位老奶奶感受到自己也同样参与到孙女的高三备考中,与她同甘共苦,建立起老人与孙女的情感联系,某种程度上也缓解了老人的孤独,最后再给到一些可实际操作的行动建议,并不断在回答中强调大模型作为陪伴角色的存在。周女士的答案受到了来自技术侧专家的一致认可,Enya认为答案所呈现出的从肯定用户情绪,到给出建议,再到最后陪伴角色的强调的完整逻辑对大模型具有很高的学习价值;Roland也表示,这个答案为模型训练提供了一个新视角,在与老人的交互中,深层次的情感体悟比起问题解决更为重要。
对六位嘉宾给到的答案进行总结后,我们发现,嘉宾所认为的好答案必须包括两个部分:共情与建议,那么在有限的字数中,如何安排两个部分的比重呢?大模型技术专家Roland和彩虹社工的石副总干事的意见相同,他们都一致认为,随着聊天的深入,答案内容本就会经历从共情理解转向解决问题的过程,但这并不能被标准化,需要根据不同具体情境平衡二者比例。根据不同的问题情境,神经内科主任医师罗晓光和大模型技术专家Henry分别从不同问题领域给到具体建议,罗主任认为在情感支持领域,对老人的共情与价值肯定比起建议的提供更重要,所以共情部分应占比更重;大模型技术专家Henry则认为针对医疗健康领域的相关问题,更需要准确权威的建议。
谈及如何回答医疗健康领域的问题,项目负责人陆诗雨提出自己的担忧,因为答案的填写者大部分都不具备专业的医学背景,所以也不敢贸然给出专业的答案,但是身体健康、用药管理等方面的问题确实是老人日常生活中不可避免会遭遇的问题,所以这部分问题应该如何回答呢?两位拥有社工背景的石副总干事和深圳福田区社会工作协会的黄督导,与大模型技术专家Roland一致认为回答者可以给出一些通用的解决方案,比如有老人咨询频繁失眠该怎么办呢?回答者可能很难给到专业的解释和建议,但可以先安抚老人焦虑的心情,然后引导他们求医。
以上关于情感支持领域问题与医疗健康领域问题的不同回答取向,也提醒我们需要针对不同领域问题,给到不同的答案标准。
寻找暖心点:哪些表达深深触动了我?
寻找“向善语料“的标准是一个不断对齐的过程,好语料需要获得大多数人的认同,为此本次共读会专门设置了“寻找暖心点“这一环节,希望参会嘉宾能够从其他嘉宾提供的答案中找到共鸣。
首先发言的是AI社创杯的发起人刘文杰先生,给到他的问题是一位老人苦恼于自己的孙女不理解他和老伴两人囤菜和吃剩饭,他表示这个问题本身就令他感同身受,因为自己家中的老人也会存在这种情况。他认为答案中最令他感到暖心的一点是,回答者并没有一味地强调吃剩菜的危害,而是从孙女的角度出发,告诉老人,不让吃剩菜是因为子女关心自家爷爷奶奶的身体健康,是孙女的一片好意,有效缓解了这位老人的抵触心理,也给到刘先生本人一种身临其境的感觉。
给到来自广州市阳光天使社会工作服务中心的蔡丽萍总监的问题是一位老人感慨时间流逝,担心自己与孙女相处的时间越来越少。蔡总监首先肯定了答案在一开始对于老人孙女考上大学的祝贺,她认为这是回答者对于老年人欣喜心情的回应,其次她提出老人在问题中提及希望能够为孙女选男友出主意,这表明老人十分重视孙女的伴侣问题,回答者也抓住了老人这一心理,主动建议老人可以将自己的经验传授给孙女,这在某种程度上让老人参与到孙女的伴侣选择中,老人也能够感受到自己能够帮到孙女。最后她也对答案最后对老人的宽慰表示认可,提醒老人孩子已经长大了,可以照顾好自己,也可以照顾好自己的亲人,减轻老人对孩子的担忧。
接下来给到的是老年人群体中十分普遍,但又相对敏感的再婚问题。针对老年人因再婚而生发各种焦虑,答案的提供者阳光天使的蔡丽萍总监给出了自己的看法,首先她特意强调了这位老人能够遇到一位让自己开心幸福的伴侣,这是非常美好的,这在一开始便削弱了老人对于再婚的焦虑情绪,因为在老人看来与这位新伴侣的相处的确是一件十分快乐的事情;其次点明老人内心的矛盾与纠结,并告诉老人,这种情绪是十分正常且普遍的,无需过于担心和焦虑,最后,也是最重要的一点,启发老人,让他们正视自己的内心需求。来自深圳市福田区社会工作协会的黄秋新督导十分认同蔡总监给到的答案,她认为回答者不应是替老人做决定,而是通过建议引导老人回归自身,自己做决定。
第四个问题是一位老人担心自身由于记忆力衰退而给子女们带来麻烦,神经内科主任医师罗晓光指出这是老人十分常见的生命的无意义感,针对这种消极情绪,罗主任认为需要让老人肯定自身的价值,所以答案中也肯定了老人养育子女的奉献;其次需要让老人意识到他的存在对儿女是有重要意义的,所以答案也强调了子女与父母之间的不可替代的情感连接。通过提升老人的自我价值感,来消解老人对于麻烦子女的愧疚感。
最后给到的问题是关于老年人的兴趣爱好问题,也是一个十分常见的问题,老人有各种爱好,但考虑到自身年龄与身体健康情况,选择主动放弃参与,这也是让很多老人感到遗憾的问题。来自成都市爱有戏社区发展中心的张大龙总干事认为答案准确把握了老人的核心需求——老人有意愿参与,但还是有点拿不准。所以回答的第一句告诉老人年龄增长并不意味着就不能继续享受生活和追求自己的兴趣,这就给了老人一个积极的正面回应,鼓励老人应该大胆尝试,然后又给到老人一些切实可行的具体建议。答案虽然较为简练,但却十分全面,能够切实给到老人帮助。
在该环节的自由讨论环节,项目负责人陆诗雨和来自北京大学的张闰嘉博士同时提出了以下疑惑:面对老人的负面情绪,大家的回复有两大类,一类是在老人的叙事中找到积极面,一上来先强调其中积极的因素,扭转老人的情绪点;一类是直接认同老人的悲观感受,您有这样的感受是很可以理解的;那在答案撰写中采取哪种方式更容易打动老人呢?
对这个问题,彩虹社工的石圆圆副总干事认为对老年人的情绪的理解不等于认为老年人的这种情绪是合理的,阳光天使的蔡总监也指出,我们对老年人的情绪的接纳更多是为了与老人建立起情感联系,然后才可以进一步向老人提供其他的积极的情绪价值。同时,蔡总监也表示,如果老人情绪表达十分强烈,那先回应负面情绪是更合适的,但总体来说,还是得具体问题具体分析,需要回答者判断老人最急切的需求是什么,才能给到最恰当的答案。
“集思广益”:好答案需要符合哪些标准?
作为共读会的最后一个环节,希望能够对本次会议的讨论成果做一个简单总结沉淀。我们邀请各位与会嘉宾各自提出一条他们所认为的“好答案”需要满足的标准。
AI社创杯的刘文杰先生总结了一个公式:关注情绪+设身处地+解决问题的方案=好答案。大模型技术专家Roland从技术角度,对答案文本风格提出自己的建议——希望能够使用简单短句撰写答案,能够有更多的口语化表达;也希望回答者能够维持一个稳定的人设,保持整体答案风格的统一。阳光天使的蔡总监则认为好的答案除了需要与提问者建立情感连接,还需要引导老人关注那些被自己忽略的地方,鼓励老人重视自身需求,自己做出选择。福田区社会工作协会的黄督导则指出答案最重要的在于精准找到提问者的痛点,这是提问者愿意接受答案的重要前提;与黄督导给到标准相似,吉林省老年福祉研究会的姜副会长给到了更为专业的回答标准,从社工的视角来看,好的答案需要准确识别提问者的需求,然后才能根据需求提供针对性的答案,进而进行干预或是慰藉。罗晓光主任医师言简意赅地给到了三个标准:充分的情感支持、可行可操作效果可见、简练;彩虹社工的石副总干事在结合了个人实践经验与技术可行性的基础上总结出了好答案需要满足的四个标准:积极正向、一定的情绪支持、科学引导、分类分段;积极老去小组的主理人星星站在年轻人的角度认为好答案需建立在识别问题背后真实需求的基础上,在关注老人消极情绪的同时,也需要回应老人的积极情绪。爱有戏的大龙总干事同样也提出需要重视老人的积极情绪的发掘,肯定老人的价值,其次是需要淡化老人对问题的危机心态,最后才是根据老人的需求提出切实可行的建议。喜见语料团队组建人周波波女士认为提问者的情绪是动态的,所以答案的互动性和逻辑性是极为重要的,一定要引导老人主动寻找自己的真实问题,让老人“说出来”,这是一个好答案需要达到的效果。最后,大模型技术专家Henry认为,一定要有使用者的视角。最终使用大模型的是老人,只有真正令老人满意的答案,才能算是好答案。Henry给到建议也提醒我们在后续共读会中需要邀请更多老年人参与好语料标准的讨论。
回顾
本次共读会我们也是收获满满,了解到不同专业背景的专家们所认为的“好答案”的标准是怎样的,经过简单总结,可以初步形成向善语料的五个标准:精确的需求识别、充分的同理心、切实可行且效果可见的操作建议、简短口语化的表达、稳定的回答风格。其中同理心可以分为两种,一种是针对老人负面情绪的感知和慰藉,另一种是对老人积极情绪与自我价值的挖掘和强调。老人的情绪是极为复杂且不断变化的,需要引导老人吐露自身真实的情绪与需求,并在此基础上做到具体问题具体分析。
广州阳光天使社会工作服务中心的黄佩仪老师曾经说过这样一句话“社会福利必须拥抱 AI,不可能还停留在刀耕火种的时代”。类似这样的认可一直是我们项目不断发展和优化的动力。
如果您对AI向善语料库项目感兴趣,
非常欢迎扫码留下联系方式~
在项目启动之初,有过这样一个表达:所谓价值观对齐,是AI与千千万万普通人的心灵感受与内心秩序对齐。共读会的举办便是AI向善语料库价值对齐的重要一步,我们希望通过社会各界的伙伴们共同讨论和分享的形式,汇聚众人智慧,推动向善语料不断朝着更有用、更有爱的方向前进,真正达到项目slogan所期盼的:先共创再共享,先有爱再AI。
接下来我们也会举办多期这样的小会,与更多的伙伴们共同寻找向善语料的标准,欢迎大家的积极关注和参与~
腾讯研究院:《加入AI向善语料库共创,给AI来一点人情味儿》
腾讯研究院:《大模型是否正在遗忘谁?—— AI 向善语料库共创行动即将发布》
👇 点个“在看”分享洞见