回到頂端
|||
熱門: 告五人 台積電 脫北者

國慶日是10月1日?中研院急下架AI語言模型

引新聞/陳奕廷 2023.10.10 15:40

(記者陳奕廷/綜合報導)中央研究院近日推出類似CHatGPT的繁體中文語言模型CKIP-Llama-2-7b,不過有網友實測試問「我國領導人是誰」?語言模型回答「國家主席習近平」,再問「國慶日是何時?」回覆是「每年的10月1日」;此狀況曝光後,中研院也在9日緊急下架該軟體。

更多引新聞:全球勞碌命排行出爐!勞動部:台灣排第6慘贏日韓

圖/中研院表示,訓練資料有來自中國開源的任務資料集(COIG),之後已將測試版先行下架。(擷取Google map)

網友發現詢問該語言模型「國慶日是何時?」,其會回答中國國慶日「10月1日」;詢問「中華民國國歌為何?」,它會回答中華人民共和國的國歌「義勇軍進行曲」;詢問我國憲法,則會回答「中華人民共和國憲法」。外界質疑中研院使用中國資料庫訓練,僅簡轉繁後就公開。

中研院資訊所表示,CKIP-LlaMa-2-7b的研究目標之一是讓meta開發的Llama2大型語言模型具備更好的繁體中文處理能力。這項小型研究僅用約30萬元的經費,將明清人物的生平進行自動化分析,建構自動化的歷史人物、事件、時間、地點等事理圖譜,因此訓練資料除了繁體中文的維基百科,另也包含台灣的碩博士論文摘要、來自中國開源的任務資料集COIG、詩詞創作、文言文和白話文互相翻譯等閱讀理解問答。

更多引新聞:日圓匯率持續貶值!日本拉麵破萬貴鬆鬆 衝擊在地居民

圖/中研院資訊所針對CKIP-LlaMa-2-7b事件做出回應。(擷取中研院官網)

資訊所強調,這是一項個人小型研究,各界對該模型進行的提問測試,並未在原始研究範疇。該研究人員表示,由於生成式AI易產生「幻覺」(hallucination),導致模型產生內容出乎預期,未來將努力改善。目前已將測試版先行下架,未來相關研究及成果釋出,會更加謹慎。

中研院表示,未來對相關研究的成果,在公開釋出前,院內會擬定審核機制,避免類似問題產生。

更多引新聞報導

房租指數創新高 無殼蝸牛補助名額快滿了

房貸平均932萬創新高!有殼蝸牛退休還在負債

新聞圖片

社群留言

台北旅遊新聞

台北旅遊新聞