吳世昌/趨勢民意調查公司總經理
今年的總統大選,民意調查受到了候選人相當大的質疑。本人從事民調工作20餘年,必須很負責任地說,直至此時此刻民調仍具有相當大的準確性,在選舉預測上甚至有「越來越準」的趨勢。
不過,傳統的市話調查由於近年來受到「涵蓋率」日漸減少,使得準確度受到影響、備受挑戰;再加上今年在民進黨、國民黨兩黨初選中,首度引入「行動電話調查」,並用50%市話、50%手機方式加總計分,成為調查的熱門話題。
除此之外,「大數據分析」也成顯學,越來越多的「網路輿情分析」成為媒體、候選人的重要參考指標,甚至作為預測略選舉的工具。但「大數據」到底準不準?在選舉中的應用為何?也是本文探討的標的。
調查要「準確」須符合機率抽樣原則
從學理來看,調查要準確、能推估全台民眾的意象,首重要的就是能符合「機率抽樣」原則。所以唯有電話調查、行動電話調查,才能符合學理,網路調查等其他方式無法做到機率抽樣,這也就是選舉民調仍以電話調查唯主要的調查方式。
至於傳統電話調查到底還有準確性嗎?抑或是要用行動電話調查來補強?趨勢民調公司為了驗證調查方法的準確性,特以選前一天民調,比照三種資料處理方式,並與選舉結果相印證,進行實證性研究。
趨勢民調比對傳統市話、純手機調查與市話併唯手機調查 市話併唯手機調查樣本結構與母體最為一致
首先,我強調個人較不認同目前業界有在用的50%家戶電話與50%行動電話結合方式,此種方式較無學理依據。目前國內外在進行機率抽樣調查時,仍以「純市話樣本」、「純手機樣本」或「市話結合唯手機族」三個方式進行,本文將進行此三種研究方法得比較
先從調查原始樣本結構來看,傳統市話被外界詬病的就是年輕樣本較低、老年樣本偏高,需要用較高的權值調整回來,從圖1可以發現,純市話20至29歲比例偏低、60歲以上比例偏高。
至於純手機則剛好顛倒過來,20至29歲遠高過於母體,但70歲以上者則遠低於母體;至於市話併唯手機族,則是在樣本與母體結構上最為近似符合。
圖1:三種調查方式樣本與母體結構比較—以年齡分
以教育程度來看,市話樣本結構在小學或以下教育程度者比例最高,大學研究所以上學歷者相對較低;純手機則剛好相反,在大學學歷者比例最高,小學及以下學歷者比例最低;至於市話併唯手機則在各教育程度上,與母體的比例最為接近。
圖2:三種調查方式樣本與母體結構比較—以教育程度分
三種調查方式加權過後結果差異不大
不過雖然三種調查方式在樣本結構上有相當大的差異,但從調查結果來看,三種調查方式在加權過後,呈現的結果都相當一致。以本次選舉為例,基本上方向、差距都不大,若硬要說差距,就是純手機因接觸到更多年輕人,導致純手機調查在民進黨的總統候選人支持率及政黨支持率上略高一些。
圖3:三種調查方式大選調查結果比較
圖4:三種調查方式政黨票調查結果比較
對比選舉結果 三種調查方式皆相當準確
若比對選舉結果,扣除未表態率重算後,可以發現三種調查都與選舉結果完全一致。從下圖可以發現,市話加唯手機族的資料裡,扣除宋楚瑜被棄保的6%並加入韓國瑜支持率,韓國於剛好是38.7%,與選舉結果完全一致;純手機調查的結果中,韓國瑜加入宋被棄保的7.6%為38.5%;純市話韓國瑜加上宋被棄保的4.9%則為38.9%;至於蔡英文總統三個調查支持率都為57%左右。民調與選舉結果差距都在小數點1%以內,而政黨票的得票結果也與民調完全一致。
圖5:三種調查方式與選舉結果比較
市話併唯手機調查為目前最佳的調查方式 但與傳統市話調查差距不大
因此與本次選舉結果印證並從最嚴格的實證研究來看,市話併唯手機的調查方式在原始調查樣本結構上與母體最為接近,調查結果也最接近實際結果,為目前最佳的電話調查方式。
不過傳統的市話或純手機調查與之相比,雖在加權前樣本結構上與母體有較大的落差,但透過統計的加權方法計算後,與實際結果差距也極微。這也顯示傳統的電話調查在選舉應用上面,到目前為止仍沒有任何問題。
網路輿情大數據「非調查」 總聲量高低非關鍵 關鍵在於「正負評」
至於網路大數據,嚴格來講大數據並非「調查」,而是「網民網路動作反應的匯整」,也非機率抽樣,不應算在「調查研究」範疇內。但由於不少大數據分析公司,都以「新式民調」為宣傳口號,再加上輿情分析卻有它的參考方面,因此本文特地將網路大數據進行說明。
以圖6來看,從趨勢民調的網路大數據搜尋引擎,以及與匯流新聞網合作的大數據長期趨勢可以發現,韓國瑜的網路聲量長期居高不下,為所有候選人之冠。但若單從網路總聲量解讀,韓國瑜「人氣最旺」肯定當選,但為何結果完全相反?
圖6:總統候選人網路聲量長期趨勢比較
再從下圖7即可知道韓國瑜為何會輸,網路總聲量韓國瑜雖高居第一,但負面聲量也長期居高不下,從CNEWS匯流新聞網封關前公布的網路聲量調查,即可發現韓國瑜負面聲量破五成,因此即使總聲量高,但要當選總統幾乎可以說是不可能的任務。
圖7:總統候選人網路聲量正負評比較
【匯流民調】民調封關前最後一次聲量調查 韓國瑜負面討論度飆破5成
再從圖8可以發現,若單比較網路聲量,時代力量的總網路聲量是高於台灣民眾黨的,但最終開出來的選票,民眾黨支持率是高於時代力量,這也說明了網路聲量與實際結果仍是會有一定差距,解讀上需更小心。
圖8:主要政黨網路聲量與正負評比較
結論:傳統市話仍最推薦 網路聲量作為輔助
整體來說,本文以選前民調與選舉結果的驗證,證明了傳統以市話為主的調查方式仍然相當準確。再加上其抽樣架構更為完整,費用相對手機調查低廉,資料處理技術也比市話加唯手機不複雜,仍是最為推薦的調查方式。
至於網路輿情大數據分析,在選戰中也將扮演越來越重要的腳色,但解讀上仍須注意,若要推估選舉結果,傳統調查方式仍是最為準確且不可取代。
未來在選戰工具應用上,網路輿情大數據應與與電話調查為互補關係,透過快速的輿情蒐集調整選戰策略,而不會產生誰取代誰的問題。
照片來源:韓國瑜臉書、資料照片
《更多匯流新聞網報導》
【2020選舉民調總檢討4-1】民調「蓋牌」害了誰 民調專家吳世昌:蓋牌是台灣選舉史上最爛的選策
【2020選舉民調總檢討4-2】選舉民調到底準不準 民調專家吳世昌:奇準無比
【匯流筆陣】
CNEWS歡迎各界投書,來稿請寄至[email protected],並請附上真實姓名、聯絡方式與職業身份簡介。
CNEWS匯流新聞網:https://cnews.com.tw
【文章轉載請註明出處】