民調透明有難度 業者:提供完整數據可行性低 可利用AI整合數據
照片為記者拍攝
【聚傳媒特約記者陳冠宇報導】每逢選舉就有許多民眾質疑民調造假,中華傳播管理學會倡議民調透明,鼓勵業者提供原始數據。對此,《ETtoday民調雲》營運長謝惠玲表示,期待各機構單位主動提供完整數據以供驗證的可行性不高,因為有些民調是受委托進行。謝惠玲建議,可以透過AI整合各家民調資訊並進行標準化,呈現趨勢分析。
謝惠玲指出,AI 可以從多個來源自動收集民調數據(例如新聞媒體、研究機構網站、公開報告),透過自然語言處理(NLP)解析民調內容,將不同格式的數據標準化成統一的數據庫。AI 模型自動辨識民調中的關鍵資訊(例如樣本數、抽樣方法、誤差範圍)以便進行後續分析。再結合應用時間序列分析模型,理應可以快速呈現不同民調數據的趨勢。透過交叉比對各機構的結果,以AI識別不同民調之間的異常差異,例如偏向特定候選人或政黨。
謝惠玲認為,AI可以進行數據異常檢測,利用異常檢測算法,AI 可發現民調數據中的不合理點,例如樣本數不足、回答分布異常或極端偏差;還可以進行抽樣方法驗證:由AI分析抽樣過程是否公平與具代表性,例如檢查是否過度偏向特定族群、地區或政治立場;至於語言與敘述分析,可以應用 NLP 分析民調問題設計中的偏頗用語,例如誘導性問題或過於模糊的選項,揭露設計問題可能導致的誤差;也可以進行歷史比對,AI可比較歷史民調數據,分析某機構過去是否持續有系統性偏差,進一步揭露數據可靠性。
謝惠玲建議可以建立即時監測與預警系統,建立 AI 即時監測系統,在民調數據出現異常時立即發出警告,例如檢測到數據過度偏向特定候選人或無法解釋的數據波動。除此之外,可以跨機構合作,鼓勵民調機構之間合作共享數據,建立更大的數據池,供 AI 模型進行更全面的學習與分析。還可以結合區塊鏈技術的導入:利用區塊鏈技術確保民調數據的透明性與不可篡改性,建立數據全程可追溯的信任機制。
中華傳播管理學會進行的AI民調透明計畫,是由財團法人臺灣民主基金會補助。