【傳播與社會學刊】議題轉移和屬性凸顯: 社交機器人、公眾和媒體議程設置研究

文摘   2024-09-19 18:00   中国香港  

《傳播與社會學刊》官方網站:http://www.cschinese.com


Issue Shifting and Attribute Salience: A Study on Agenda Setting among Social Bots, the Public, and the Media



作者簡介:

趙蓓:北京師範大學藝術與傳媒學院博士後

張洪忠:北京師範大學新聞傳播學院教授

摘要:

近年來,社交機器人廣泛參與到社交媒體對話中,成為影響公眾輿論的新興力量。社交機器人通過擴大信息規模,製造信息的虛假流行,是否干預了社交網絡議程形成?本研究以中美貿易爭端為例,從議程設置理論視角出發,探討社交機器人、公眾、媒體在社交網絡中的互動機制。研究發現在第一層議程設置中,社交機器人議程對公眾議程產生正向影響;在第二層議程設置中社交機器人議程與公眾議程之間不是單向的影響模式,而是一個複雜而動態的互動,主要有三種互動機制:一是社交機器人議程影響公眾議程;二是公眾議程影響社交機器人議程;三是社交機器人議程與公眾議程相互影響。此外,媒體在第一層議程設置中表現出較強的議程設置能力,對社交機器人和公眾產生影響,而在第二層實質屬性中,媒體議程設置效果要弱於社交機器人和公眾,在負面情感屬性中媒體也受到了社交機器人的影響。與之前的研究相比,社交機器人第二層議程設置時間滯後明顯縮短。


Abstract:

In recent years, social bots have participated widely in social media conversations and have become an emerging force in influencing public opinion. By expanding the scale of information and creating the prevalence of false information, have social bots interfered with the trend of the social network agenda? Taking the China-US trade dispute as an example, this study uses the perspective of agenda-setting theory to explore the interactions between social bots, the public, and the media within social networks. First, the study finds that in first-level agenda setting, the social bots’ agenda has a positive impact on the public agenda. However, in second-level agenda setting, the relationship between the social bots and the public is not characterized by a one-way influence; rather, it reveals a complex and dynamic interaction. Specifically, there are three main interactive mechanisms: (1) the social bots’ agenda affects the public agenda; (2) the public agenda affects the social bots’ agenda; (3) the social bots’ agenda and the public agenda influence each other. The media reveals a strong agenda-setting ability in first-level agenda setting, which has an impact on both social bots and the public; however, it shows that the effect of media agenda setting in the second level of substantive attributes is weaker than the effect of social bots and the public. In the negative affective attribute, the media is also affected by social bots. Finally, compared with previous studies, the time lag of social bots in second-level agenda setting is significantly shortened in our study.


01

引言

通過擴大信息規模,製造信息的虛假流行,社交機器人是否干預了社交網絡議程走向?通過對議題不同側面的描述,社交機器人是否操縱了公眾對該議題的認知?在社交機器人參與的社交媒體討論中議程設置時間滯後是否發生變化?本研究將目光聚焦於中美貿易爭端,從議程設置理論視角出發,探討社交機器人、公眾、媒體在社交網絡中的互動機制。創新之處在於將社交機器人作為新的傳播主體,研究其對整個社交網絡信息流動產生的影響,對議程設置理論而言具有重要的理論貢獻。同時,本研究對社交機器人議程進行實證研究,實現了從以技術為中心的解釋向以傳播學為中心解釋的轉變,為我們深刻理解社交機器人的應用和發展提供支持。

基於此提出以下研究假設和研究問題:

H1:在中美貿易爭端討論中,社交機器人議程會影響公眾議程。

H2:在中美貿易爭端的討論中,媒體議程會影響公眾議程。

H3:媒體議程會影響社交機器人議程,社交機器人議程也會影響媒體議程。

H4a:社交機器人實質屬性議程對公眾實質屬性議程產生正向影響。

H4b:社交機器人情感屬性議程對公眾情感屬性議程產生正向影響。

H5a:媒體實質屬性議程對公眾實質屬性議程產生正向影響。 

H5b:媒體情感屬性議程對公眾情感屬性議程產生正向影響。

H6a:媒體實質屬性議程影響社交機器人實質屬性議程,社交機器人實質屬性議程也可以影響媒體實質屬性議程。

H6b:媒體情感屬性議程影響社交機器人情感屬性議程,社交機器人情感屬性議程也可以影響媒體情感屬性議程。

Q1a:在第一層議程設置研究中,社交機器人產生議程設置的時間滯後是多久?

Q1b:在第二層議程設置研究中,社交機器人產生議程設置的時間滯後是多久?



02

研究設計與方法

數據採集與處理

為了獲取更具代表性的數據,研究者通過Google Trends 搜索中美貿易爭端在2018 年3 月至2020 年9 月之間的熱度。可以看到2019 年5月中美雙方多次「交鋒」,相關搜索熱度持續升溫,使其成為熱度最高的時間段。因此選取2019 年5 月1 日至5 月31 日(31 天)作為本研究的時間段。

通過Python 使用TweetScraper 庫去獲取推文(tweet)。以「tradewar」為關鍵詞,篩選時間為2019 年5 月1 日至31 日的所有推文信息。最終獲取約26 萬條原始數據,在刪除重複推文後得到217,505 條。為便於後續操作和分析,對非英語推文進行識別和刪除,最後得到211,088 條英文推文,其中獨立用戶85,856 個。


社交機器人檢測

本研究採用了印第安納大學的開源工具Botometer(前身是 BotOrNot)。它可以通過機器學習來計算一個概率值(0–1),其中分數越接近1 越可能是機器帳戶。自2014 年發佈以來,Botometer 已成為目前檢測Twitter 社交機器人最為成熟和廣泛使用的工具。

在檢測中發現一些帳戶無法檢測予以刪除,最後得到71,012 個帳戶的Botmeter 得分(見圖一)。



根據其他學者(Badawy, Ferrara, & Lerman, 2018; Ferrara, 2017)的經驗通常將Botometer 得分在0.5 以上的判定為社交機器人。在本數據集中,採用了較為保守的做法,將得分在0.6 以上的判定為社交機器人,社交機器人佔比為13.36%,產生了18.98% 的推文(見表一)。

為了對媒體帳戶進行識別,本研究首先獲取了所有帳戶的認證信息,其中4,252 個認證帳戶,對這部分帳戶進行人工識別,檢查Twitter主頁的個人介紹或根據內容判斷該帳戶是否媒體帳戶,最後得到媒體帳戶1,373 個。在獲取認證信息時有部分帳戶已註銷或處於被保護狀態無法獲取到信息。根據經驗,認證帳戶一般在較短的時間內不會註銷帳戶,因此將這部分帳戶歸類為公眾帳戶。


內容分析方法

I.編碼框架

在進行內容分析前,對社交機器人、公眾和媒體所產生的推文進行了分類。鑒於本數據集的數量較大、內容分析複雜,首先採用分層抽樣方法對推文進行抽樣。本研究以天為層,從每天中隨機抽取一定比例(5%)的數據,在最終的樣本中總共包含了6,738 條公眾推文, 1,591 條社交機器人推文,462 條媒體推文進行人工編碼,確定編碼框架。根據之前研究者的經驗(Baumann, Zheng, & McCombs, 2018; Han, Lee, & McCombs, 2017; Lee & Min, 2020; McCombs, Lopez-Escobar, & Llamas, 2000),將議題的屬性分為實質屬性和情感屬性兩大類。

在本研究中實質屬性指的是在中美貿易爭端討論中不同的認知側面或特徵,主要涉及中美貿易爭端產生的各種影響、立場、原因、結果等屬性。情感屬性指的是對實質屬性的情感或態度,主要包括正、負、中三種情感傾向(見表二)。在本研究中正面的情感指對該實質屬性體現出肯定的、讚賞的、樂觀的態度(如:對貿易爭端升級表示樂觀,對美方提高關稅表示肯定等)。負面的情感屬性則指的是對該實質屬性表現出否定、質疑、批評、消極的態度(如:對貿易爭端對經濟造成的傷害表示擔憂,對未來股市的發展表示恐懼,對特朗普政府的行為表示質疑等)。而中立的情感屬性指的則是該條推文沒有明確表現出對該實質屬性的情感態度(如:一些客觀陳述事實的信息)。



II.計算機輔助內容分析

在確立編碼框架後,研究者採用了計算機輔助內容分析方法對整體數據集進行分析。

首先,對抽樣數據進行定性評估,確定關鍵詞列表(見表三)。將之前編碼所得同一屬性下的所有推文放到一個文本中進行處理(包括轉化為小寫、去除空格/符號等無效字符、去除停用詞、將文本進行單詞分列並進行原型化處理)。統計每一個分詞出現的頻率,將出現頻率較高(如果該屬性分詞較多,則對前60% 進行了檢查,如果該屬性分詞較少則檢查了全部分詞)且具有一定代表性和排他性(通過TF-IDF 計算分詞在整個文本中的重要性)的分詞作為該屬性的關鍵詞。然後,對全樣本數據進行預處理,確保與關鍵詞列表相匹配。

本研究使用python 編寫程序執行查詢,當一條推文與某個屬性的一個或多個關鍵字匹配時,就會被程序標記1,沒有匹配時標記為0。然後從每個屬性中抽取100 條數據進行檢驗,結果發現是有效的。所有屬性的搜索查詢結果與人工編碼結果較為一致,平均為.83,最低得分為.79。



其次,利用SentiStrength 來分析推文的情感屬性。在對文本進行情感分析後,隨機抽取了200 條推文進行人工編碼,結果具有一定可信度(kappa 系數 .82)。


III.格蘭傑因果關係檢驗

格蘭傑因果關係指的是如果從變量X 和Y 的過去值比單獨從Y 的過去值能更好地預測變量Y,那麽X 稱之為Y 的「格蘭傑原因」(Freeman, 1983)。使用這種方法來檢驗一組時間序列數據之間的因果關係在議程設置研究中得到了廣泛應用(Guo & Vargo, 2020; Heijkant, Selm, Hellsten, & Vliegenthart, 2019; Vargo, Guo, & Amazeen, 2018),在解釋兩個變量因果關係上具有較高的可信度。

在對兩個議題相關數據進行分析時以小時為單位進行檢驗,最終得到中美貿易爭端744 個時間點。這種時間滯後設置方式可能會因為人們生活作息方式而產生偽回歸。在本研究中,由於中美貿易爭端是全球關注的議題,不同半球的公眾都可能會參與該議題的討論,因此不會產生所謂的因為人類作息而引起的誤差。另外,根據收集到的數據顯示,並未呈現出明顯的晝夜特點。



03

研究結果

議題轉移:第一層議程設置分析

本研究在第一層議程設置中將中美貿易爭端作為單一議題,在社交網絡中考察社交機器人、公眾與媒體之間的互動關係。按照時間先後順序統計每小時內媒體對該議題的報道數量(在這裡是推文數量)作為媒體議程測量的指標;將每小時內公眾對該議題的關注(推文的數量)作為公眾議程測量指標;最後,根據Botometer 檢測結果,將社交機器人在一定時間段內發佈有關推文的數量作為社交機器人對某議題的關注,即社交機器人議程。


I.議程相關性分析

通過時間序列相關性分析發現,社交機器人議程、公眾議程和媒體議程之間存在顯著正相關關係,其中社交機器人與公眾之間皮爾遜(Pearson)相關係數為 .92(p < .001),社交機器人與媒體之間相關係數為 .83(p < .001),媒體和公眾之間的相關係數為0.90(p < .001)。社交機器人議程與公眾議程之間的相關性更高,聯繫更為緊密。



II.格蘭傑因果關係檢驗

結果顯示,社交機器人議程是公眾議程的格蘭傑原因,F 值為2.23(p < .001),支持假設H1。可以解釋為社交機器人發佈推文數量的增多會影響公眾對該議題的關注,說明在社交網絡中部署大規模的社交機器人會對公眾議程產生一定影響。此外,媒體議程是公眾議程和社交機器人議程的格蘭傑因果關係,F 值分別為1.96(p < .01)和2.39(p <.001),同時媒體議程與公眾議程和社交機器人議程之間的影響是單向的,說明媒體對中美貿易爭端的關注會導致公眾和媒體對該議題的關注,議題顯著性發生轉移,由此支持H2 和部分支持H3,媒體在整個社交網絡空間中仍然具備強大影響力。

在第一層議程設置中,社交機器人對公眾產生議程設置的時間滯後是25 小時,與之前的研究相比,並沒有發現顯著改變,由此回答問題Q1a。在社交網絡中,社交機器人雖然擁有快速擴散信息的功能,但是否發揮作用還受到很多因素的影響。在中美貿易爭端中,普通民眾獲取信息的需求並不是十分迫切,議題轉移的速度也因此受限。



屬性凸顯:第二層議程設置分析

I.實質屬性重要性排序

由於社交機器人、公眾、媒體本身的數據量級差異較大,且一條推文可能包含多個屬性,所以在屬性顯著性的測量上,計算的是一段時間內該屬性被提及的次數佔該時段推文總數的比例,最後得到的實質屬性重要性排序見圖四。

在所有屬性中,「經濟」和「對抗」是被社交機器人、公眾和媒體強調最多的屬性,說明在整個社交媒體討論中,不管是哪一方均比較關注貿易爭端對經濟產生的影響,同時「對抗」是這場討論的「主旋律」。此外,通過對比發現社交機器人與媒體屬性議程間一致性更高,重點關注「全球影響」、「外交」、「科技戰」,而公眾則對「特朗普政府」、「結果」、「農業」、「原因」、「政治」五個屬性的關注十分凸顯。



II.實質屬性格蘭傑因果關係檢驗

進一步對每個屬性進行格蘭傑因果關係檢驗,探討社交機器人、公眾和媒體在每個屬性中的互動關係,結果見表四。

第一,社交機器人屬性議程與公眾屬性議程之間存在三種互動機制。一、社交機器人屬性議程影響公眾議題屬性議程。研究顯示在「經濟」、「政治」、「其他影響」、「科技戰」四個屬性的格蘭傑因果關係中具備統計學意義上的顯著性(p < .05)。說明在這四個屬性中,社交機器人對屬性的突出呈現會影響公眾對該屬性的關注;二、公眾屬性議程影響社交機器人屬性議程。在「外交」、「原因」、「策略」三個屬性中格蘭傑因果關係具備統計學意義上的顯著性(p < .05)。說明公眾在中美貿易爭端對兩國外交關係的影響、爭端的原因或應對策略的呈現會影響社交機器人對這幾個議題屬性關注度增加;三、社交機器人屬性議程與公眾屬性議程相互影響。根據之前的研究社交媒體中屬性的轉移大多在短時間完成,格蘭傑因果關係檢驗的是在一定時間內的多個回歸結果,在「對抗」和「結果」屬性的討論中,可能會產生相互影響。總的來看社交機器人在更多屬性中對公眾產生影響,支持假設H4a。

第二,公眾屬性議程與媒體屬性議程之間的關係。在格蘭傑因果關係檢驗中,公眾在七個屬性中對媒體產生影響,媒體在五個屬性中對公眾產生影響,在兩個屬性中二者產生了相互影響,由此可見,在中美貿易爭端討論中媒體與公眾之間也存在複雜而動態的影響關係,公眾在更多的屬性中設置媒體議程,由此拒絕假設H5a。

第三,社交機器人屬性議程與媒體屬性議程之間的關係。社交機器人在五個屬性中對媒體產生影響,媒體只在兩個屬性中對社交機器人產生影響,二者在三個屬性中產生了相互影響。社交機器人在更多的屬性中設置媒體議程,由此部分支持假設H6a。

對時間滯後進行分析發現,社交機器人產生議程設置的最短時間滯後是一小時,最長是五小時。與之前的研究相比,社交機器人議程設置時間滯後明顯縮短,回答問題Q1b。



I.情感屬性分析

在中美貿易爭端議題中,負面情感佔據較多比例,社交機器人、公眾、媒體分別佔比48.18%、48.23%、47.35%;其次是中立情感,分別佔比43.74%、38.92% 和43.01%;正面情感佔比最少,分別為8.08%、 12.85% 和9.64%。具體來說,中美貿易爭端對雙方和世界造成的影響都是巨大的,涉及經濟、科技、政治等各個方面,伴隨著關稅的提升,普通消費者不得不付出代價。基於中美貿易爭端造成的影響,討論的文本也以負面情感居多。

以小時為單位分別構建負面情感屬性和正面情感屬性的時間序列(見圖五和圖六)。圖中橫坐標代表的是時間節點,縱坐標代表情感傾向在對應時間點的佔比。如圖所示三者在分佈的位置上有一定相似性,社交機器人對應的情緒值高點,同時也是公眾情緒對應的高點。在負面情感屬性中社交機器人與公眾之間的趨勢一致,呈現出下降趨勢,但降幅不高只有2% 左右,媒體則呈上升趨勢,增幅較大接近 12%;在正面情感屬性中,三者趨勢一致,且公眾正面情感屬性佔比高於媒體和社交機器人。



情感屬性格蘭傑因果關係檢驗結果見圖七。首先,在負面情感屬性表現上,社交機器人是媒體的格蘭傑原因,F 值為2.78(p < .01);公眾是社交機器人的格蘭傑原因,F 值為3.29(p < .01);同時公眾與媒體互為對方的格蘭傑原因,F 值分別為2.39(p < .05)和2.46(p < .05)。由此可見,在負面情感屬性呈現上三者之間關係比較複雜,存在社交機器人影響媒體,媒體影響公眾,公眾又影響社交機器人的循環互動,說明負面情感屬性在網絡中實現了多重轉移。其次,是在正面情感屬性表現上。公眾是媒體的格蘭傑原因(3.20**),媒體是社交機器人的格蘭傑原因(4.56***),社交機器人並未發現任何格蘭傑因果關係。

綜上,在情感屬性中,社交機器人沒有對公眾產生正向影響,反而是公眾在負面情感屬性中對社交機器人產生了正向影響,由此拒絕假設H4b;在媒體與公眾之間,負面情感屬性呈現出互為因果關係,正面情感中公眾是媒體的格蘭傑原因,部分支持H5b;最後是在負面情感屬性中社交機器人對媒體產生影響,在正面情感屬性中,媒體對社交機器人產生影響,由此支持H6b。在情感屬性議程設置中時間滯後分別為八小時(負面)和六小時(正面),回答問題Q1b。




04

結論與討論

首先,本文探討了社交機器人在兩個層面對公眾議程產生影響。研究發現在第一層議程設置中,社交機器人對公眾議程產生正向影響,社交機器人通過不斷發佈與中美貿易爭端有關的信息,可以引起公眾對該議題的重視。在社交網絡中,越來越多的國家或組織選擇部署社交機器人來實現宣傳或引導輿論的目的。通過在不同平台上散播虛假信息,或自動發佈與議題有關的信息,模擬人類行為並參與到人類用戶交流中(Stieglitz et al., 2017),社交機器人吸引了大量公眾注意力,在議題呈現上對公眾起到顯著正向影響。

第二,本文探討了社交機器人與媒體之間的議程設置。在整個社交網絡中,媒體作為公眾獲取信息的重要來源仍然發揮著重要影響。在第一層議程設置中,研究發現媒體在中美貿易爭端中表現出了較強的議程設置能力,不僅對公眾議程產生影響,同時也對社交機器人議程產生影響。需要注意的是社交機器人正在成為影響媒體議程的潛在力量,在第二層議程設置中社交機器人在更多實質屬性中對媒體產生影響,在負面情感屬性中社交機器人同樣對媒體產生正向影響。

第三,時間變量是議程設置研究中的關鍵因素,研究發現在社交機器人參與的社交媒體討論中議程設置的時間滯後發生變化。通過格蘭傑因果關係檢驗中構建的向量自回歸模型得到的第一層議程設置最佳時間滯後為25 小時。第二層議程設置研究各實質屬性時間滯後在一小時到五小時之間,情感屬性議程設置時間滯後分別為八小時(負面)和六小時(正面),與之前的研究相比,社交機器人議程設置時間滯後明顯縮短。



·The End·


本文系簡寫版,參考文獻從略,原文刊載於《傳播與社會學刊》第59期。


點擊左下角「閱讀原文」,查看全文內容。


《傳播與社會學刊》

可長按二維碼了解學刊最新動態!

投稿資訊請於官網查詢


Comm and Soc传播研究新视野
《传播与社会学刊》交流平台
 最新文章