论文之道
——敏锐深邃的洞见让人信服
本栏目每期推荐一篇与非遗影像相关的学术论文,以北大核心期刊及以上论文为主。
录像民族志在人机交互研究中的可能与可为
摘要:民族志在人文社会科学,特别是人类学、社会学和传播学等领域得到了广泛应用。在过去半个世纪,民族志与人机交互研究在西方已经形成了丰富的交叉融合,产出了很多学科碰撞的研究成果,但遗憾的是,中文学界对于这一交叉领域的探讨和应用仍较为少见。鉴于此,本文旨在介绍基于常人方法学的“录像民族志”在人机交互研究中的应用。本文通过回顾录像民族志在过去半个世纪以来人机交互研究中的经典案例,探讨了传统民族志与录像民族志之间的微妙差异与内在共性;同时,结合笔者自身在中国本土收集的人机交互素材,阐述了录像民族志为人机交互研究提供关于序列性、身体性和隐蔽劳动相关层面的独特分析思路和分析要点,并展望了录像民族志在我国本土人机交互研究中的可能与可为。
关键词:地方感;美国阿帕拉契亚;田野调查;民俗学
作者简介
甘雨梅:上海交通大学媒体与传播学院助理教授、中美富布莱特学者(2019)、上海市浦江人才(2022)。研究方向聚焦于数字底层、人机交互、青少年儿童与智能媒体。
一、引言
在人机交互领域,学者露西·萨奇曼(Lucy Suchman)以其卓越的研究贡献而备受瞩目。她有关人机交流的著作《人机重构:计划与情境行动》(Human-machine reconfigurations:Plans and situated actions)是技术研究和人机研究领域必读经典。这部著作诞生背景可以追溯到1979年(Suchman,2007,p.8):彼时还是加州伯克利大学文化人类学专业博士生的萨奇曼,到美国加州施乐公司帕罗奥多研究中心(Palo Alto Research Center,又常被写为XeroxPARC)担任研究助理。施乐公司在办公室光学设备(尤其是复印机)方面的成功,使之成为当时美国科技公司中的翘楚。在美式英语中,施乐品牌名称“Xerox”甚至一度成为“复印”的代名词。当时,Xerox推出了一款大型复印机,但是这款复印机的销售在市场上遇到了巨大阻碍。众多用户纷纷反馈该设备操作复杂(Suchman,2007,p.9)、难以掌握。销售部门经理从纽约前往加州帕罗奥多研究中心,期望研究中心同事能够从研究角度为产品提出技术优化思路。这一难题不仅妨碍了复印机的市场推广,也引发了人们对于人机交互的深刻反思。
萨奇曼说服她的同事们,在帕罗奥多研究中心安装了这个操作复杂的复印机。随后,她用录像机录制了她的同事们使用复印机的现场过程。用她自己的话说,她的录像记录了大批杰出计算机科学家作为这台复印机的用户首次尝试使用这个交互式界面的全过程;录像还捕捉了许多计算机工程师围绕在这台复印机周围讨论、指导交互界面的生动现场(Suchman,2007,p.10,p.118,footnote4)。有了录像素材之后,萨奇曼开始基于哈罗德·加芬克尔(Harold Garfinkel)提出的常人方法学(ethnomethodology)视角分析录像中的行为。她创造性地绘制了一种录像转写方法,分别标注了人和机器的行为顺序。她尤其关注用户在使用这台复印机时出现的故障。她对故障的细致分析得出:技术或者机器的设计失败往往是因为设计层面错误配对了计划行为和情境行为。她的研究不仅显著推进了技术改进和设计,更值得一提的是,她将常人方法学、民族志以及录像分析这类方法引入科技研究领域,对该领域研究范式的更新产生了深远影响。
萨奇曼所用之研究方法的核心,正是本文期望进一步介绍和阐述的录像民族志。这种方法论也被部分学者称为“常人方法学式的民族志”(ethnomethodological ethnography)(Eisenmann & Mitchell,2024)。自萨奇曼之后,已有许多交叉学科的学者,尤其是来自计算机科学、设计学、人类学、社会学、传播学领域的研究者,通过录像民族志方法展开人机交互研究。遗憾的是,中文学界对于这一交叉领域的探讨和应用较为少见,对于这一方法的介绍仍显不足。为此,本文旨在介绍这一方法并阐述它在人机交互研究中的可能与可为。本文的核心内容聚焦在三个方面:其一,研究将从传统民族志与人机交互的交叉谈起,回顾民族志方法进入科技研究领域的起源、现状和潜力;其二,介绍录像民族志与人机交互的交流碰撞,探讨录像民族志与传统民族志之间的微妙差异与内在共性,并回顾过去半个世纪以来录像民族志在人机交互研究中的经典案例;其三,结合笔者在中国本土收集的人机交互领域经验素材,本文将阐述录像民族志的基本分析理路以及它为人机交互研究提供关于序列性、身体性和隐蔽劳动相关层面的独特思路和价值。通过以上阐述,本文期望基于传统经典研究,以“旧”创“新”,讨论和思考新闻传播学中人机交互前沿研究的范式路径,并进一步发掘这一传统经典方法在本土研究中的潜力。
二、田野中的机器故事:民族志与人机交互
纵观民族志的发展历程,我们看到它与人机交互的交融碰撞在二十世纪七八十年代就已开始。民族志凭借其挖掘田野故事的洞察力(Van Maanen,2011),为阐释在地文化提供了理论源泉。与人机交互研究的融合进一步拓展了民族志探寻人与机器、人与技术故事的能力。下文简要概述民族志的历时演变以及在人机交互研究中的涌现,以期为读者了解这两者交融提供历史情境。
(一)传统民族志的历时演变
作为一项具有严谨学科属性的方法论实践,民族志始于人类学。现代人类学多把民族志的提出和发展归功于波兰裔人类学家马林诺夫斯基。二十世纪初叶,马氏前往巴布亚新几内亚特罗布里恩群岛,学会了土著语言,与当地人一起生活,并调研他们的风俗文化。随后,他写成了系列经典著作,其中最广为人知的《西太平洋上的航海者》成为民族志奠基之作。马氏在书中细致描绘了自己在西太平洋这个小岛上的田野工作,并系统整理出具体步骤和调研策略。他提出,民族志作为“科学方法”之核心在于经历长年累月的辛劳之后能够“把握原住民视角”(Malinowski,1922,p.25)。马氏在当时可能并未想到这一方法会在后来的工业化、机器化、数字化时代大放异彩,但作为研究方法的民族志自此就开始展现了它为研究者提供深入田野场景的方法论价值。
几乎在同一历史时期,民族志在美国学界以略有不同的风格出现在社会科学研究中。以罗伯特·帕克(Robert Park)、威廉·托马斯(William Thomas)等人及其学生们为代表的芝加哥社会学派将民族志方法应用到社会学调查中。芝加哥社会学派关于民族志的应用具有一些独特标志,他们将民族志的关注人群从遥远的异域土著转移到了身边的城市生活。作为“大熔炉”的芝加哥城市也似乎为此提供了一个天然的场所,让研究者探索不同语言不同文化之间的碰撞组合。一些学者将芝加哥社会学派对于民族志的应用称为“将人类学带回了家”(Button & Sharrock,2009)。这种使用民族志来研究身边社会的做法无疑意义重大,为后来民族志与日常生活场景的结合(包括民族志与日常科技使用的交叉)做好了有力铺垫。
此后,民族志的发展还经历了以列维斯特劳斯(Claude Levi-Strauss)为代表的结构主义转向以及以格尔茨(Clifford Geertz)为代表的诠释主义转向。本文无意阐述民族志和现代人类学的详细发展过程,但是,结构主义与诠释主义两次转向同样为后来民族志与人机交互研究的融合起到了助推作用。列维斯特劳斯试图将索绪尔的结构语言学运用到人类学研究中,开始关注作为“系统”的神话,而不再将神话或文化看作独立的表象和个案。这一思想的引入对此后人机交互研究的影响在于将系统化思维(或者说事件的系统化)作为分析的单元而非将某个独立的行为本身作为核心。1973年,格尔茨带着他享誉学界的著作《文化的诠释》翻开了民族志崭新的一页。他强调,民族志学者应该在与当地人谈话中“深描”他们的言行,包括眼神、动作,哪怕是一个抽搐,也应被详细描写和观察,以此建构并理解以当地人主体性为基准点的文化生活(Geertz,1973)。格尔茨的深描为后来人机交互中民族志的运用提供了更为具象的实操建议,对于理解人作为意义之网上的动物也提供了方法论支撑。
(二)民族志在人机交互研究中的涌现与繁荣
民族志在人机交互研究中的涌现与技术研究中的两大动向紧密相关。
一是人机交互以跨学科面貌出现,并开始关注技术的社会面。来自全球各地的计算机科学、认知科学、社会学、传播学、人类学、语言学学者纷纷开始从事相关研究。这一学术社群的建立促进了人们对于技术的社会认知:技术的发展不再仅是科技问题,技术设计和技术改进需要考量社会和人文因素。1983年,美国计算机学会主导举办了“计算机系统中的人为因素”会议(Conference on Human Factors in Computing Systems,简称CHI),成为学者们探讨技术社会问题的重要阵地,这一会议迄今仍是全球最有影响力的人机交互会议。在此后十余年间,人机交互领域又出现了一个叫作“计算机支持的协同工作”(Computer Supported Cooperative Work,简称CSCW)分支,开始关注工作环境中的交互界面。这些发展和变化对研究人机交互的方法论和范式提出了挑战。学者们开始讨论:什么样的方法论能够帮助研究者深入技术的社会面并且能深入到社会组织、社会工作场合中的人机交互场景?以上问题天然地为民族志在人机交互中的应用提供了契机和土壤。
二是参与式设计(participatory design)理念在全球技术研究和科技研发领域崭露头角,促进了民族志方法在人机交互领域的应用,使之成为理解计算机用户的重要手段(Dourish,2006)。参与式设计非常关注技术和计算机用户的体验,为此需要寻求并深挖参与成员(用户)观点。在此过程中,民族志成了参与式设计的一种实用方法,它似乎为这样的人机交互场景提供了一种理解现实世界复杂性的手段,并为探索“自然状态下的技术研究”提供了工具包。这里的“自然状态下”指的是技术实际应用的现实环境,与实验室或受控环境相对。学者们不仅开始使用这种方法进行经验研究,也开始讨论该方法在参与式设计中使用的实操优势及理论挑战(Anderson,1994;Crabtree,1998)。
在我国传播学界,学者们也已逐步开始探讨人机交互领域的研究范式问题。他们关注不同方法的应用。例如,通过心理学实验、访谈以及思辨等方法,学者们探索人机交互中的人机关系并展望人机传播的未来(申琦、王璐瑜,2021;彭兰,2022;牟怡、官奕聪,2023;向安玲、许可;2023)。在民族志与人机交互方面,尽管我国较少有传播学学者直接阐明其采用的民族志方法是专为人机交互研究所用,然而,他们运用民族志为人机交互带来的深刻洞见正在迅速涌现。这些研究通过传播民族志来探讨人与各类技术物品、机器、媒介的互动关系及其对个体和社会结构的影响。郭建斌聚焦民族地区数字媒介实践,多年来不仅身体力行在中国本土“做”传播民族志研究,更有力地将媒介技术与家庭、与民族仪式等重要维度结合起来。他将媒体技术带入“家”的做法,与西方人机交互研究将技术放置于工作环境、家庭环境的趋势不谋而合,刻画出鲜活的媒介机器进入家庭引发的新型人机互动现场(郭建斌、王亮,2021)。孙信茹通过大量的媒介人类学实践,将民族志方法运用到线上社群。她的研究进一步拓展了网络民族志的边界,在互联网人机互动时代书写了生动的“人的叙事”(孙信茹,2022)。孙萍通过民族志走进智能技术时代新职业群体,如外卖小哥。她细微地观察和调研,发现了智能时代人机交互的技术逻辑和物质属性。例如,她发现“颜色鲜亮的制服、头盔、电动车、护膝、手套、手机”等物质实体其实构成了智能技术的基础设施,这些基础设施不仅在城市实体方面形成了更新,也在空间和阶层话语层面产生了新的权力意义(孙萍,2019)。这样的民族志研究深化了我们对技术的思考,也鼓励更多技术设计融入伦理道德考量(陈昌凤,2022),并因此激发着更多更新的民族志研究为新型人机交互形态提供深入场景的阐释。
三、影像中的现场互动:从民族志到录像民族志
录像民族志与传统民族志有着千丝万缕的联系,却又在交融碰撞的学术旅行中逐渐演变为两支具有独特气质又相互依存的方法论。厘清两者的异同有助于在经验和理论层面理解其价值。下文先阐释录像民族志作为“常人方法学式的民族志”之独有特性,并简述它与传统民族志的微妙差异,同时,通过录像民族志与人机交互研究经典案例介绍为读者理解录像民族志的分析框架提供背景。
(一)录像民族志作为常人方法学式的民族志
一定程度上说,起源于常人方法学的录像民族志并不完全是一种方法论,也绝非收集素材之简单工具,而是一种观看世界和分析社会的视角(Garfinkel,1967;Sharrock & Anderson,1986)。通过民族志方法收集到录像素材之后,对录像的后期分析才是这一方法的核心所在。许多学者曾表示,尽管该视角在人机交互领域已广泛应用并产生了包括萨奇曼等人研究在内的众多有影响力的成果,但学界对其“理解仍严重不足”(Dourish & Button,1998,p.398)。为此,要理解录像民族志,不妨在此先简要回顾常人方法学要旨。
1953年,著名社会学家帕森斯(Talcott Parsons)的一名博士生给现象学家舒茨(Alfred Schütz)写了一封信,信中寄去了他自己的一些文章,并表示他从舒茨的思想中获得了很大的启发。这位学生告诉舒茨,他正在试图系统地摧毁传统社会学所建构的结构意义,说他想研究人们的“自然和科学态度”。舒茨回了信,鼓励这位学生。长达四页的回信中,舒茨希望这位学生可以成为“这座尚未被发现的宝藏岛之探险者之一”。在与舒茨通信的几年后,这位学生开始提出“常人方法学”视角,试图颠覆和补充社会学中对于传统结构的研究。这位学生正是哈罗德·加芬克尔。
加芬克尔于1967年出版了《常人方法学研究》一书,让常人方法学正式进入社会科学话语体系。他发明了看起来极其复杂的词汇“ethnomethodology”(常人方法学),在书中又以十分晦涩难懂的长句阐述这一方法。他在书之开篇就写道:常人方法学通过分析日常活动,使这些活动可以在所有实际目的上变得“可见、合理且可报告”,即日常活动的组织应是“可解释的”(Garfinkel,1967,p.vii)。读者从原文引用可看到,他所使用的词汇和连接符号让本身复杂的新视角又新增了理解难度。有学者戏称,或许正是因为加芬克尔所用词汇太过复杂,导致常人方法学的传播和推广一直面临阻碍(Sharrock & Anderson,1986)。
对加芬克尔而言,常人方法学视角期望为社会科学的研究提供一种“可替代方案”。这种可替代方案期望从认知论角度(epistemological)重新审视一些社会学基本概念。加芬克尔以格式塔心理学中广为人知的“鸭兔错觉”问题(见图1)来阐释常人方法学的独特性。他论证说,常人方法学期望把“到底怎么样”(just-how)这个问题搞清楚。如果你把这个图看作鸭子,那就意味着这是一系列连贯特征的过程。然而,鸭子的特征不能和兔子的特征同时被看到。你可以想到“兔子”,但在这一瞬间看不到它。换言之,常人方法学的核心,并非在于要一眼看到鸭子或者兔子,而是要注意它是如何构成的(Garfinkel,2022,p.122)。
同样,他将格式塔转移到社会生活的研究中,强调研究者并非需要去生活中寻找所谓的阶级、性别、权力等传统社会学概念,而应在实际中去观察和分析这些概念如何在高度复杂的社会实践中“被达成”。这种范式的转变,正如库恩在《科学革命的结构》中所直言的,鸭兔视觉格式塔转换可以作为基本原型来说明科学家世界观和研究范式的转变。“革命之前科学家世界的鸭子,到革命之后就成了兔子”(库恩,1962/2022)。在科学视野的训练过程中,某一学派实则是通过引导学生进行多次视觉转变的训练,使他们逐渐被培养出所谓专业的眼光。
常人方法学的内核鼓励着后来的研究者寻找具体方法去记录所谓社会生活达成的过程。为此,初期的常人方法学者采用录音的方式记录一些社会互动过程(Sacks et al.,1974)。随着技术设备的更新和便捷,录像成为常人方法学研究的核心手段(甘雨梅,2020)。无论是录音还是录像,中心旨意都是为了收集到具有现场感和场景性的社会互动素材。而获取录像的过程往往和传统民族志相仿,需要研究者走进参与者的生活情境。也正因如此,很多学者也把常人方法学收集录像的过程本身看作民族志研究。然而,这两者的核心区别其实在于收集到录像素材之后面对录像的“分析心态”(Schenkein,1978)截然不同。这些分析心态在录像民族志作为研究方法的基本分析单元、关键分析步骤和重点分析内容中就可见一斑(下文通过本土案例进一步阐述)。如此一来,录像民族志的分析着重观察参与者对于自身行为的阐释,即参与者如何让自己的行为变得“可见”或“可解释”。换言之,录像民族志可以理解为“民族志+录像分析”两个阶段的深度融合。对于民族志的运用,更像是田野调查过程为了获取互动现场以及在地实践的工具;而录像分析步骤,则为了发现具体行为发生的时间性次序以及随着时间逐渐展开的互动秩序。
(二)录像民族志与人机交互的混合研究
常人方法学式的录像民族志被用在人机交互研究当中,是加芬克尔后期很大的学术理想。加芬克尔(Garfinkel,2002)在常人方法学发展中声称,要让研究变得独特,那就需要挖掘这类研究的“混合可能性”。他所说的混合是指研究和具体行动者之间的联系。例如,他期望有关音乐家、医生、数学家、教师、技术工程师的研究能够让这些专业人员产生直接兴趣。在加芬克尔的影响下,他的得意门生利文斯顿(Eric Livingston)为了研究数学家如何生产数学知识,花费了数年时间去学习数学。当然,加芬克尔的混合研究思路也带来了后期诸多常人方法学家的担心。波纳(Pollner,2012)指出,常人方法学可能会因为太过追求混合性而越来越远离社会学甚至社会科学,走向具体某一行业领域。
经过多年发展,人机交互领域可以说是常人方法学混合研究旨趣实现得最为成功的场所。在人机交互领域,研究人员大多关注详细的技术设置以及这些设置所带来的技术端、用户端影响,这与常人方法学对于细节的关注不谋而合。常人方法学式的民族志将这些技术使用过程详细录制下来,反过来也为这些研究人员提供了最接近真实的素材。道瑞许(Paul Dourish)和巴顿(Graham Button)将常人方法学与人机交互研究的结合称为“技术方法论”,他们认为,常人方法学的观点有助于系统设计师发现特定情境下的真正问题(Dourish & Button,1998)。
使用录像民族志方式展开的人机交互经典研究已经跨越了诸多不同的技术场景。本文开篇提到的萨奇曼研究是其中重要代表作之一,更多的研究也开始关注到工作场合、家庭场域的人机交互。早期学者的探究内容包括:空中交通管制员如何与飞机交互(Goodwin & Goodwin,1996)、软件工程师如何工作(Sharrock & Anderson,1993)、视频会议协同(Heath & Luff,1992)、医疗互动中的计算机问题(Greatbatch et al.,1993)等。时至今日,录像民族志与人机交互的研究仍十分活跃。这些研究主要在三个领域方向针对人机交互问题作出回应:
其一,关注人机交互行为与传统人际行为的差异。以英国社会学家希斯(Christian Heath)团队、法国传播学家利可布(Christian Licoppe)的录像研究为例,他们获取了大量视频中介化传播(video-mediated communication)在医疗、日常、法院等场景的运用,通过录像发现媒介中介化的人机互动过程与面对面人际沟通不同,视频互动中“谁先说话”的问题与技术故障息息相关(Heath & Luff,1992;Licoppe & Morel,2012)。其二,有大批录像民族志研究走进组织环境中阐释机器或者技术的角色。美国语言人类学家古德温夫妇的研究(Charles Goodwin和Marjorie H. Goodwin)在这一领域独具特色。他们不仅创造了极具美感的视频转写方式,用以展现机器与组织的微妙关系,更通过提出“专业视界”的理论视角阐释了所谓的职业工作与物品、技术相交织的过程(Goodwin,1994)。其三,录像民族志开始关注技术和机器在不同文化与地区的应用。欧洲正在涌现大批学者通过录像方式调研欧洲城市空间中出现的机器、AI或者新技术,如踏板车(McIlvenny,2019)、送货机器人(Pelikan et al.,2024)、智能音箱(Porcheron et al.,2018)。在中国,通过录像民族志开展的相关研究包括:人工智能实践下的人脸识别服务酒店(许馨芷,2022)、智能机器人咖啡亭(甘雨梅、郭良文,2022)、移动支付(李荣誉,2024)等。这些研究不仅聚焦于智能化机器融入现实生活后所引发的交互方式改变,同时,通过录像可以清晰地展示不同人群在使用机器方面的差异性,进而揭示隐藏在人机交互背后的新型智能数字鸿沟等问题。
四、录像民族志的基本分析路径:以本土人机交互素材为例
伴随着新闻传播学中人机交互议题的日益凸显,该领域的前沿探讨逐渐受到全球学者重视。中国本土在人机交互方面的丰富实践已成为国内外社会科学领域研究的热点。如前文所提及的,尽管国内学界对于录像民族志的讨论还较少,但有经验研究已开始使用这一视角走进中国本土人与机器、人与技术之故事。本节将结合笔者在国内收集的部分人机交互录像素材,通过展示和分析一些视频片段来阐述录像民族志在人机交互研究运用中的一些重要分析步骤,包括录像转写、基本分析单元和关键分析步骤等,以期和读者探讨录像民族志作为研究方法在人机交互研究中的可能可为。
(一)转写和分析人机交互的序列
在研究者通过录像民族志收集到人机交互的视频数据后,对这些视频的分析遵循着独特的分析路径,这也是录像民族志与传统民族志的主要区别。传统民族志的实施在很大程度上依赖于研究者自身,其数据分析方法因研究者的理论取向而异。例如,某些民族志学者在田野调查结束后可能会采用访谈主题分析法来处理数据。然而,录像民族志对视频数据的依赖远超过对研究者的依赖。通常,录像分析包括几个关键步骤:第一,对视频数据详细地进行转写;第二,对互动行为进行序列分析;第三,收集大量相同行为的序列以进行比较和分析;第四,针对这些序列,深入分析其传播资源和互动资源,包括言语、非言语、物质以及环境等多个方面的交互;第五,整理分析结果并撰写结论。
录像转写是录像分析的起点,其方式和数据呈现与分析框架紧密相连。为了有效地进行录像转写,首先需要认识到录像民族志的基本分析单元是“序列”。所有的录像转写工作都是为了清晰呈现互动中的序列。所谓序列,是指社会行为发生的次序和结构性组织。根据录像民族志理念,对话和互动均遵循着一种顺序性的组织原则,即各种行为是依次发生的(Schegloff,2007)。序列以及序列组织是录像分析的基石,也是这一方法独特且最为核心的分析要点。斯蒂弗斯(Tanya Stivers)曾言,正是对序列组织的重视使得录像分析与社会科学中其他研究语言和互动的方法截然不同(Stivers,2013,p.191)。在录像分析视角下,互动过程中每一句话语(包括语言及非语言元素)的位置与顺序均具有重要意义,而序列则是深入理解人们在交谈中产生各种行为的关键所在。
以人机交互的录像民族志研究为例,当研究者通过录像田野收集到人机交互的互动素材后,会依据时间序列对录像内容进行详尽转写。研究者通常会使用阿拉伯数字序号来标注行为的次序。如图2所示,该素材来自笔者录制的人机交互场景,是在四川农村留守家庭进行民族志调研时获取的。这段素材展示了留守儿童与祖父母使用微信视频电话与外出打工的父母进行媒介化互动的过程。图2呈现了一个5秒钟视频片段的录像转写,我们据此谈论序列的内涵与应用。
可以看到,这种转写极大地区别于访谈转写,它通过顺序化的、极为细致的行为标注以及文字与图片的结合,尽可能生动地再现互动过程。以本录像片段为证,采用序号标记01~05清晰地呈现了交互行为的序列;并通过双括号方式添加语言之外的身体动作、环境特征等描述(Jefferson,2004)。在录像分析方法中,序列指的是某个社会行为从开始到完成的整个过程,通常至少需要两个说话人的参与才能完成。以常见的社会行为为例,“邀请”行为需要得到“接受”或“拒绝”的回应,“打招呼”需要得到相应的“回应招呼”。只有当某个行为得到了相应的回应,我们才认为一个序列得以完成。以本片段为例,第01行,哥哥指出了互动中的故障,这本身并不构成一个完整的序列,但它“启动了一个序列”。直到第03行,妈妈移动手机来回应哥哥的问题,这才完成了一个序列。换言之,01~03行构成了一个“指出问题—回应问题”的序列,这也是录像分析中最基本的分析单元。深入剖析这些序列单元,我们得以洞察到传统研究方法难以触及的细微之处:在本片段中,儿童在视频通话中未能完全看到母亲的脸部(见图2a),这引发了他在第01行的提问:“为什么看不到你的脸?”这一提问不仅揭示了媒介操作中的具体问题,更重要的是触发了互动对象的自我调整。随后,第03行,母亲调整了手机位置,使自己的脸部完全出现在视频中,从而实现了有效的沟通。这一过程也从侧面反映了传播学中热议的媒介可供性问题,以及所谓的技术可供性与实际应用之间的差异。尽管视频通话界面的设计核心理念是“可见性”,但在实际使用中,这种可见性并非总是能够自然实现。这进一步印证了现场人机互动与实验室设想之间的鸿沟。换言之,技术的设计理念和实际应用之间存在微妙的差距,这需要我们更深入地走进场景和情境去理解和研究技术。
录像分析对序列的关注,要求研究者在分析过程中着重厘清人们在完成某一特定序列时所涉及的各类互动和传播资源。这些传播资源包括了言语(词汇、音调、音律、情感表达等)和非言语(身体、物质、媒介等)要素,要素分析组成了录像分析的关键步骤。继续以图2为例,完成01~03行的序列,我们看到人们使用了话语、身体和手机资源。以身体和手机关系为例,该简短片段也可引起我们对媒介化互动中身体问题的进一步探讨。母亲移动手机摄像头这一微妙瞬间,在其他研究方法中可能被忽略,但录像分析却将这些细节视为分析重点,希望以此厘清人、技术、身体和物质之间的核心关系。实际上,母亲这一行为呼应了利可布等学者在视频电话研究中的发现,即人们在使用视频通话时,需要不断调整自己“说话的头”(talking head)(Licoppe & Morel,2012)。他们的研究将戈夫曼自我呈现理论引入具体的人机交互环境,揭示了在视频通话这种人机交互行为中,自我呈现主要聚焦于头部而非整体身体。当然,展示此片段并非旨在提出有关身体的具体论点,而是为了让读者通过此案例感受录像分析在探讨序列和身体等议题方面所具有的潜力。
(二)注重分析人机交互中的隐蔽工夫
除了关注序列和完成序列所需的传播资源,录像民族志还为研究者提供了直观的分析视角,以便深入洞察人机交互中那些容易被忽视的“隐蔽的人力工作(工夫)”,这种分析取向强调观察人的行为在人机交互中的影响。在人工智能行业内流传着一句戏言,“有多少人工,就有多少智能”,从侧面反映了人工智能对人力工作的高度依赖。通过录像民族志的方法,我们有机会走近并揭示这些隐蔽的人力工夫。
图3展示了笔者在录像数据中的另一项重要发现。这三组图像展示的是:农村家庭中负责照护留守儿童的祖辈利用手机为外出务工的父母提供孩子的实时画面。他们一般把手机对着小孩,期望让打工父母可以在手机中看到小孩。然而,深入分析这些视频和图片,我们发现,即便祖辈有意识地调整手机摄像头对准儿童所在位置,但由于手机屏幕尺寸有限,远程的父母在很多时候实际上无法清晰地看到孩子。具体来说,在图3a中,手机屏幕画面主要呈现的是一片空白的天花板;图3b中,仅能看到模糊的半边头部和孩子的耳朵;而图3c里,只有孩子的头发和背后的门依稀可辨。若采用传统的现场观察方法,即研究者亲自前往参与者的生活环境进行观察,将难以捕捉到这种隐蔽的人力工夫情况。而通过录像并分析祖辈手机上的实时画面,我们能够清晰地观察到这类问题频繁发生。当这类技术故障出现时,它要求祖辈不仅能熟练操作手机,还具备一定的技术素养,以确保儿童与其外出务工的父母之间能够建立有效的媒介化屏幕沟通(Gan et al.,2020),这些分析也为改进技术提供了思考视角。
通过深入的录像分析,我们能够观察到人机互动过程中所涉及的平凡、智慧且充满挑战的人类劳动。付出这些劳动或者工夫的,可能是运用这些技术的每一位普通用户。这种分析取向要求录像学者关注人机交互中的人以及人的行为对人机交互效果之影响。基于图3案例,我们对“用户”这一概念有了更为深入和全面的理解,父母和儿童的视频通话中所涉及的用户并非仅有父母和儿童,这一分析展示了祖辈在留守儿童照护和媒介化沟通中的关键角色(甘雨梅,2023)。正是在这种方法论的指导下,录像民族志有机会助力研究者更深入地洞察人机交互的复杂性、丰富性和多元过程,成为我们在“在地化”情境中更全面理解人机交互的方法。
当然,如上文所述,使用录像民族志展开分析之时,重点聚焦序列、传播资源、隐蔽劳动,这些分析要点都指向了互动的具体过程,也就是“怎么样”这一问题。这种分析理路体现了录像民族志的优势所在,但同时也带有一定局限性。这种视角难以深入探究用户的心理状态。若研究者旨在探讨用户“为何”选择使用某种技术,那么录像民族志方法或许并非最佳的方法论。但若研究者的关注点在于用户“如何使用”科技产品,那么录像民族志则能为其提供有力的分析工具。
五、结语与展望
萨奇曼(Suchman,2007,p.118)写道,录像方法的采用并不意味着对传统铅笔记录的否定。相反,这种方法提供了一个全新视角,类似于文中我们引用的鸭兔错觉图所揭示的视觉相对性一样,让我们能换一种眼光来审视和理解社会现象。本文立足于录像民族志的视野,从传统民族志与人机交互的交融与碰撞开始,剖析了录像民族志与传统民族志之间的微妙差异,介绍了以常人方法学为核心的录像民族志在分析思路上的特征。通过回顾历史发展脉络,本文着重阐述了录像民族志在人机交互研究领域的独特价值。同时,本文从笔者在中国本土收集到的录像素材出发,探讨了录像民族志在分析过程中的几个关键环节。这些环节包括重视录像内容的序列转写、进行序列性分析、关注完成某个特定序列所需的传播资源,以及着重观察那些在人机交互中不易察觉的人类劳动。通过这一系列细致的分析步骤,我们可以更深入地理解录像中的人机交互形态。
从这些意义来看,将录像民族志运用在人机交互研究之中的核心就在于将人机交互过程“具体化”。当我们把人与机器、人与技术的交互视为一种成就之时,研究者的首要任务就是深入剖析这些成就是如何逐步实现的。通过这种方式,人机交互的复杂流程可以被细化为解决一系列具体问题的详细序列。借助常人方法学式的民族志视角,我们的目标并非简单地将理论观点融入人机交互的研究中,而是深入人机交互的实际场景,探寻参与者在实践中所运用和依据的实践策略。这一过程要求我们转变传统的观察视角,更加关注交互过程中的细节,从而能够将那些看似最平常的活动,哪怕只是移动了一下手机,也视作重要的社会成就。
本文旨在为学界探讨人机交互研究范式提供一些启示和思考方向。尽管目前录像民族志在我国传播学或人机交互领域的应用相对较少,但已有学者通过结合传统民族志和其他方法,在人机交互研究方面取得了深刻的洞见,同时也有少量的录像民族志研究开始涌现。在理论和方法的本土化过程中,我们需要进一步实现理论和实践层面的融合。具体而言,在我国开展录像民族志研究时,我们既要清晰地理解和汲取西方录像民族志的关键理论概念,又要从具体分析的角度出发,探索该方法在中国特定语境和文化背景下的分析框架,从而实现本土性与世界性的有机结合。
从理论层面来看,结合录像民族志特点,我们需要深化对常人方法学的理解,认识到它并非仅是一种抽象的理论视角。目前,国内学界对常人方法学的探讨多偏重于理论阐述,而在经验和实证研究方面仍显不足。主要原因在于,常人方法学往往被视为一种社会理论。然而,加芬克尔(Garfinkel,1967)一直强调,常人方法学并非单纯的理论视野。他在多部著作中明确指出,常人方法学既不是纯粹的理论,也不是具体的方法论。相反,它更像是一种研究课题,专注于探究常人的行动方式,是一种研究实践行为和实践推理的独特视角。因此,在录像民族志本土化的进程中,我们应将对常人方法学的理解从纯理论层面转向经验研究,赋予其更鲜明的实践特色,从而在本土经验研究中发挥其独特价值。
从具体分析框架而言,当我们在中国应用录像民族志于人机交互或其他研究领域时,应着重考虑中国独特的文化特质对(人机)互动模式的影响。这些文化特质实际上为录像民族志的经验研究提供了丰富的素材,同时也是将中国特有的人机互动现象引入国际社会科学领域的一个重要途径。例如,本文通过农村家庭成员与手机的交互案例,探讨了祖辈作为手机用户如何协助外出务工的父母与留守的子女进行视频通话。在这一过程中,中国家庭独特的代际抚育文化得到了充分体现。与西方学界在使用录像民族志研究人机交互时更多关注效率和技术的改进不同,录像民族志在中国的发展或许可以更多地关注本土文化背景对人机交互的影响。这包括本土文化观念如何改变人机之间的信任关系,以及本土文化如何在人机交互中得到体现和重塑。在当今中国,人机交互已经深度嵌入人们的日常生活,技术与人们的行为模式紧密相连。期待有更多的研究能够关注到中国独特的观念和文化特征如何影响人机交互,以及这些影响如何带来互动模式和互动序列的变迁。
论文之道
扫描二维码,进入更多
非遗影像学术天地
执行主编:邓备 任露露
编辑:刘昭
技术:王屹飞 李文飞
版式:李祖玉
统筹:刘广宇 朱靖江
本期主办:西南民族大学新闻传播学院
四川师范大学民族民俗文化研究中心
学术支持:中国高校影视学会纪录片专委会
“中国节日志”编辑部
中国民族志纪录片学术双年展策展委员会
广西民族志影展策展组委会
技术支持:田野守望(重庆)影视传媒有限公司