AI查核假民調 學者:可依據AMITT進行初期探勘的歸類
照片為記者拍攝
【聚傳媒特約記者陳冠宇報導】每逢選舉各種民調就紛紛出現,其中有許多民調讓人懷疑是造假,學者建議可以參考「惡意不實資訊與影響力戰略技術分析架構(AMITT)」來進行初期探勘的歸類。
銘傳大學廣電系主任杜聖聰接受中華傳播管理學會的訪談指出,從荷蘭的「公共數據研究室」提供的打擊假訊息來看,其程式可以分為以下階段:輸入URL到CrowdTangle,觀看其中的假新聞報導網址、分享URL的Facebook頁面和社團、觀察每一頁面或社團的互動次數、分享訊息發佈的日期;完成上述步驟後藉以辨識具有最高假新聞報導。
按照學者陳百齡歸類,防制假新聞主要有懲假、制假、打假、辨假四端。。至於事實查核,陳百齡認為主要有四種工具:(1)消息來源查核工具(2)時間查核工具(3)空間位置查核工具(4)網路監看和典藏工具。
杜聖聰說,查找不實訊息與查找不實民調相仿,均是一種以數位鑑識、AI判讀學習與影響力操作狙殺鍊分析等相關技術為核心,建立數位信任偵測分析與防護機制。希望鏈結在地產學研能量,發展有效偵測、濾除、追蹤與鑑別解析各類型不實訊息/民調的生成、散播等手法之核心技術;同時整合對應資安新興應用(例如謠言檢視、虛假帳號、內容農場等),接軌產業現有防護方案,落實於實務場域(例如如廣電媒體、警政國安、企業運營、民生經濟等),促成對應數位鑑識/數位信任產業生態鏈。
杜聖聰表示,國內資策會的AI處理不實訊息的操作,主要有這八個項目。至於,形成不實訊息在看板層級部分,透過SJ Terp 與 Credibility Coalition 共同創立的不實訊息分析框架,特別是針對資安領域分析駭客時,歸納不同的攻擊階段與技術。也就是所謂的惡意不實資訊與影響力戰略技術分析架構(AMITT),包括其階段、目標與實際執行方式所建構的中文資訊看板,並參照性質層級的七個類目,分別置入不實訊息影響力狙殺鏈查找之標記,可以有以下的標誌。
杜聖聰表示,查找不實民調的概念,也可以參酌AMITT的本土化看板,進行初期探勘的歸類操作。未來,不實民調分類器的設計,可分為監督式學習(Supervised Learning)、非監督式學習(Un-Supervised Learning)和半監督式學習(Semi-Supervised Learning)等三種。監督式學習需要標記大量資料,實務上,資料標記需要大量人力,因此,非監督式學習,也引起大家的關注,較差的辨識效果是非監督式學習模式最大的缺點,而半監督式學習則介於兩者之間,僅需標記少量資料,三者之間,各有其優缺點,如何在大量人力標記與辨識效果之間取得平衡點,會是實務操作上非常重要的議題。
杜聖聰認為,未來查找不實民調的作法,不妨歸類為區塊鏈、深度學習、統計法和傳統機器學習等方法。每一項作法的特性說明如下:(一) 區塊鏈:顧名思義其為多個區塊所組成,每個區塊包含前個區塊的密碼雜湊函式和交易資料,這也使區塊內容擁有難以竄改的特性。(二) 統計法:通常這類方法會利用多種方法來查找資料中的特性,較為常見方法為資料探勘。(三) 傳統機器學習:相較於深度學習,這類方法須先將資料特徵進行標記才能從資料中找出特定資料。(四) 深度學習:為機器學習的一個子領域,由於計算方法類似於人腦中的神經元而得名,不同於傳統的機器學習,在特徵提取方面深度學習是不需要進行人工標記。