全民查假會社》國防安全民調 學者:數據有問題
【愛傳媒全民查假會社專欄】國防安全研究院網站四月發表國防安全民意調查之評析,經檢視內容,學者指出,本調查已主觀認定與國防安全的國際關係,只有「與美國緊密結盟」與「對中國釋出善意」。不過自1987解嚴至2016年,「臺灣同時與大陸、美國維持善意」是個長達30年存續的客觀事實,該調查卻沒有「同時與大陸、美國維持善意」的選項,本調查造成的主觀宣導,多於客觀研究。
此外,調查報告回答次數為1535次,超過所謂「有效樣本」的1437份,證明統計軟體操作員、事後加權員、和報告撰寫人,對統計原理均不熟悉。各自為政,造成記錄、設定、操作、原始數字、加權數字與報告選用數字不同步,出現答題者超過所謂「有效樣本」的怪現象。
本次解讀民調報告如下:
解讀日期:2023年5月2日
民調日期:2023年3月23日至3月29日
民調主題:台灣國防安全民意調查
報導機構:大紀元、上報、青年日報、中央廣播電臺
執行機構:財團法人國防安全研究院委託國立政治大學選舉研究中心執行電話訪問調查
調查地區:台灣(不含金門、馬祖)
樣本/誤差:調查對象是居住在台灣(不含金門、馬祖)年滿18歲以上的成年人。實際訪問完成677份市話樣本、858份手機樣本,合計1,535份樣本。樣本根據性別、年齡、教育程度與居住地進行「反覆法」(raking)加權,檢定後與母體無顯著差異,以95%之信心水準估計,最大可能隨機抽樣誤差為正負2.50%。
民調摘要:國防安全研究院網站四月發表國防安全民意調查之評析,公開三篇評析內容,內容說明此民調共詢問五個問題:「是否贊成義務役役期延長至一年?」、「有人說:『美國對台的軍事援助將把台灣推向戰爭』,請問您同不同意這種說法?」、「如果兩岸發生戰爭,請問您認為美國會不會出兵幫助台灣?」、「請問您認為我國政府現階段維繫國家安全與台海和平最重要的作法是什麼?是強化自身國防戰力、與美國緊密結盟,還是對中國大陸釋出善意呢(訪員讀題時選項次序隨機出現)?」續問「那第二重要的作法是什麼?」
調查結果顯示,約八成五的民眾贊成義務役役期延長至一年,其中非常贊成約為63%,有點贊成約為22%;美國對台的軍事援助將把台灣推向戰爭?60%受訪者不同意,34%同意;如果兩岸發生戰爭,請問您認為美國會不會出兵幫助台灣?有55%的受訪者認為會,37%認為不會。在維繫國家安全與台海和平最重要的作法部分,民調顯示約45.9%的民眾主張「強化自身國防戰力」,占比最高;其次為「對中國釋出善意」,約占28.3%;最後是「與美國緊密結盟」(18.0%)。在第二重要的作法部分,「強化自身國防戰力」依舊占比最高。
爭點解讀:
一、此民調藉由兩道題進行詢問,給予受訪者三個選項,分別是強化自身國防戰力、與美國緊密結盟、對中國大陸釋出善意。進行重要度調查,這樣的問法,受訪者僅能在限制選項下做選擇,且既然將重要度分級,意味不能複選,是否對此問題的探討產生爭議或偏差?
二、表一將重要的作法之三個選項進行次數與百分比呈現,次數總計為1535次,不過有效樣本為1437份,這部分是否存在問題?
專家分析:
世新大學資訊管理系前主任吳統雄解讀:
本案無法脫離「資訊系統綁架困境」,其報告之「抽樣誤差」不僅是錯的,對採用替代樣本,而形成的非隨機/非等機率樣本而言,根本是無意義的(請參見2022.08.08《看懂民調》對「抽樣誤差」的解說)。而採用沒有因果關係的「加權法」,本調查改稱「比例膨脹」和「反復法」,只是美化數字,可能反而擴大誤差(請參見2022.10.06《看懂民調》對「加權法」的解說)。同時,將來源不同的市內電話樣本與手機樣本相加,違背統計基本原理:「無關母群不可相加」。
本調查不能夠推論為代表全臺灣民眾的意見。但其樣本仍具分散性,只要沒有作假,可以代表所訪問的 1535 個樣本。唯亦非原始數字,而是經過多次加權後美化而失真、甚至產生矛盾的面貌,本次第二爭點,尤其能夠證明此後果。
當前民意調查,由於社會環境、生活方式、以及「知溝愈來愈擴大」,較適合「形象測量」,亦即相對較簡單與具體的問題;不易執行「深度測量」亦即複雜與需要大觀照的問題。即使書面上是「深度測量」,實際獲得還是「形象認知」(請參見2022.12.19《看懂民調》對「形象測量」或「深度測量」的解說)。
在多元社會,以民意調查為工具,作各種倡議、宣傳,只要沒有作假,報導「形象認知」也屬言論自由的一種。但「形象認知」通常無法協助「問題解決」,甚至有可能擴大問題。
本調查的委托人是「國防安全研究院」,是國防部成立的智庫,如果目的是要倡議「強化自身國防戰力」,以爭取國防預算,可以理解。
如果本調查是真的要作為擬訂國防政策的依據,則本調查的研究方法必須作非常嚴肅的檢討與修訂。
爭點一解讀
「國防安全」顯然是「深度測量」問題,測量工具通常有3種:
--開放式測量:即問答題,必須配合「內容分析」。
--封閉式測量:即選擇題,選項集合必須「完整」,選項之間必須「獨立與互斥」。
--專家測量、或焦點團體測量。
一、開放式測量:即問答題,必須配合「內容分析」。
採用開放式測量、問答題的理由是:觀察到底有多少人真正瞭解「深度問題」,並能提出「問題解決」方案,而方案可以有那些?
開放式測量後續必須配合「內容分析」,程序非常複雜,要求極為細膩與嚴謹的檢定。當前火紅的 ChatGpt,就是以内容分析為基礎、加上模式庫與參數庫所建構的,坊間民調機構並不容易作到。
開放式測量的回應數字通常不會很高,卻反映了「相對的真實」。
根據「TX 人類取用模式」在美國喬治亞理工實驗室的數理模擬預測與在臺灣的實證檢驗,發現會主動關注與參與公共事務者的參數正常上限為65%。
所以,在正常的民主政權、正常的選舉下,投票率不易超過65%。
倒反而在集權政權、偶爾舉行的選舉儀式中,投票率幾乎都超過90%,甚至可達100%。
前者相對較低的數字,較可以反映事實真相;而後者的超高數字,不僅可能不是「一致」的表現,反而可能是被迫與扭曲的結果。
同理,各種民調,過高的數字,有可能是受知識所限,無意中採用不當加權等造成的不實美化;也無法排除有故意不實扭曲的可能。
二、封閉式測量:即選擇題,選項集合必須「完整」,選項之間必須「獨立與互斥」。
封閉式測量選擇題的題目,在學理上必須先經過「量表建構」的程序,而當前坊間民調幾乎全部沒做,而是以主觀命題。
「量表建構」的第一步,就是「預試」,先建立一個小樣本,採用上節的「開放式測量」,或實施「題庫測量」。
如果實施「題庫測量」,下一步就是「淨化測量」,最常採用的就是「因素分析」技術,以達成選項集合必須「完整」,選項之間必須「獨立與互斥」。
即使沒做「因素分析」,就「知識邏輯」也可能觀察出是否達成以上條件。
以本調查為例,已主觀認定與國防安全的國際關係,只有「與美國緊密結盟」與「對中國釋出善意」。
為何沒有「同時與大陸、美國維持善意」的選項?
自1987解嚴至2016年,「臺灣同時與大陸、美國維持善意」是個長達30年存續的客觀事實!為何要排除這個選項?(善意是指相對性,文長有限,在此不闡述。)
另外,有一些創意選項,如「臺灣主動調解大陸、美國爭議」,「臺灣中立化」…等,既然是「民意調查」,為何不測量人民對這些不同倡議的態度?
而「強化自身國防戰力」與其他2選項,並無「獨立與互斥」關係,可以同時存在,也可以同時不存在。
真正具備「獨立與互斥」區別力的選項是:「擴大非武裝範圍、加強非戰區默契」。這是我們在金門已經實施的政策、且是有良好效果的政策,并非空穴來風,又為什麼被主觀忽略、還是隱藏?為何不測量人民對避免戰爭的態度?本調查造成的主觀宣導,多於客觀研究。
三、專家測量、或焦點團體測量。
這種調查法常用的的是「大慧調查 Delphi Survey」技術,以後有適當個案再介述。
爭點二解讀
本爭點反映「有效樣本」一詞,長期被坊間民調誤會與誤用的現象。
統計定義上,如果某樣本的某「變項」取得觀察值,則其值稱為「有效(valid value)值」,該樣本的該變項為「有效(valid)變項」。
如果沒有取得觀察值,稱為出現「迷失值(missing value, 或譯「遺漏值」,但事實上不僅「遺漏」而已)」,該樣本的該變項即為「無效(invalid)變項」。
「有效、無效」一般是針對「變項」而言。但有些人分不清楚「變項」和「樣本」不同。一個樣本經常有很多觀察變項,其中有些可能有效、有些可能無效,所有樣本不會有相同的數字。英文報表輸出的術語是 valid cases,但中文版直譯成為「有效樣本」,並未精確表達僅限該單一變項,所以「有效樣本」是一個極容易產生誤解的名詞。
在統計應用程序上,對個別問題分析的一般預設是 pair wise deletion 方法,即僅排除「迷失值(missing value)」。但可以改採用 list wise deletion 方法,將含有任何無效變項的樣本剔除,就會輸出各變項valid 數字一致的「有效樣本」。但在調查實務上,如果是中等以上長度的問卷,一定有不少受訪者不會答完每一題,這樣處理後剩下的有效樣本必然偏低,損失調查資訊,也浪費成本。
當前坊間民調機構,較多是把「沒有中斷的樣本」,逕稱為「有效樣本」,而各家的「沒有中斷」定義也不見得一致,所以坊間的「有效樣本」常為既無學理依據,也常無一致標準的陋稱。
統計軟體有1支「概況」程式,報表可同時列出 pair wise deletion 方法,和 list wise deletion 方法的數字,如果不會看報表,也會選錯,而和問題的數字不搭配,屬於不知道而產生的錯誤。如果會看報表,而一定有「有效變項」的數字比「有效樣本」多,而故意選擇很大的「有效變項」數字,偽稱為「有效樣本」數字,則屬於作假的一種。
現在坊間民調全部採用「不隨機/不等機率的替代樣本法」,分派樣本時,早期總臺還會設定「性別配額」控制,雖然也是「不隨機/不等機率法」,但還保存一個變項原始數字。後來「加權法」盛行,民調機構為快速完成與節省成本,再不合理的數字,日後也可以加權解決,不再管控原始資料。
電訪系統並不能輸出加權數字,都是事後多次加工,原始收集偏少的變項,為美化成一致,會被膨脹為更大的數字,也和原始資料相差更遠,可能產生更大的誤差。
調查報告回答次數為1535次,超過所謂「有效樣本」的1437份,證明統計軟體操作員、事後加權員、和報告撰寫人,對統計原理均不熟悉。各自為政,造成記錄、設定、操作、原始數字、加權數字與報告選用數字不同步,出現答題者超過所謂「有效樣本」的怪現象。
本專欄為全民查假會社「看懂民調專案」之報告,全民查假會社官網網址為:https://tstm.tw/
●專欄文章,不代表i-Media 愛傳媒立場