「抓到了?!」用數據分析鳥瞰 PTT 政治文帳號 (下)
承續上篇文章,本篇將針對網軍特點二:網軍上線時間長、反應快,來進行研析。然而從外部,我們並沒有辦法廣泛了解每個PTT用戶的上線與下線時間,因此我們從另一個線索:「文章反應時間」來進行探討。針對使用者 u 對於文章 a 的評論,其文章反應時間的計算方法如下
文章反應時間 T(u,a) = 使用者 u 對於文章 a 的第一則回應時間 - 文章 a 的發表時間
算出來的數值代表每個使用者在看到某候選人相關文章出現後,該使用者所發表的第一則回應與文章發表時間的差距,由此方法衡量各使用者對於各候選人相關討論文章的回應速度。若使用者回應文章數量多,且當文章發布後,可以在相當短的時間內進行回應,文章反應速度快,我們認為可以視為使用者付出大量上線時間在 PTT ,而能即時進行相關討論的佐證。
我們將使用者對於特定候選人的回應極性與反應時間(取各篇文章反應時間之中位數),做成圖二。圖二顯示,確實有數位使用者反應速度與評論數都較大多數的使用者突出,有至少50%的回應在文章發表三十分鐘內就完成回覆,且這些使用者針對候選人相關文章總評論數高達數百甚至達數千,符合我們認為網軍需要文章反應速度快且回應多的特點。在讓我們回到網軍特點一:有明顯的政治偏好、回應多。我們列出部分對於特定候選人有特別政治極性,評論數量高,且反應速度快的使用者於表二。依據該表,我們將三種不同特性的活躍使用者列出其特色:
- 種類一:使用者 010, 063 有至少 50% 的回應在文章發表後 6 分鐘內即進行回應,幾乎是文章發表後就能即時跟上並進行評論;而其總發表數量皆超過 1000 則,且對特定候選人相關文章持正面極性,另兩位候選人持負面極性。
- 種類二:使用者 001, 003 則非常活躍進行文章評論,各發表超過 10,000 則與 5,000 則,並對於特定候選人相關文章有相當積極的正面回應行為,而對於其餘兩位候選人文章則明顯有回應數量落差。通常也能在 10-18 分鐘內就進行文章回應完成。
- 種類三:使用者 052, 050, 005 則對於特定候選人有明顯正面或反面的意見,但反應時間相較於前述四位使用者較長,約文章發表後數十分鐘進行回應。
我們也透過人工判讀這些使用者的推噓文極性與實際發表內容之政治立場是否一致,避免極性與支持立場有不同的可能發生。結果這些使用者的推噓極性與其文字透露出來的政治立場一致。由此數據,筆者認為種類一與種類二使用者符合本研究企圖找出的網軍特色。
然而證明特定使用者是網軍本身就是一個難題,除非有實體驗證程序,如專業偵查判斷,否則無法單純透過帳號的回應速度快與回應極性,就證實該帳號為網軍。但筆者希望透過大規模且長期的行為分析,提供不同面向的 PTT 使用者觀察角度,並透過資料來證實有多位使用者有本系列文章所提出的兩項網軍特性。筆者期望拋磚引玉,引起更多對於此議題從資料觀點的研究佐證,最終目標希望能讓台灣網路訊息的傳播能更透明與真實。