回到頂端
|||
熱門: 柯文哲 京華城 葡萄桑颱風

【柳子厚專欄】出售虛假參考文獻的計劃震驚了科學家

銳傳媒/特別報導 2024.08.20 22:12

研究誠信觀察者對科學家偽造或操縱其研究的引用計數的方式越來越多感到擔憂。近幾個月來,越來越大膽的做法浮現。一種方法是透過一次誘騙行動揭露出來的,在該行動中,一組研究人員購買了 50 條引用,以填充他們創建的假科學家的 Google 學術檔案。達爾梅特·辛格·查瓦拉 Dalmeet Singh Chawla發表在最新一期《自然》(Nature)的<引文黑市:出售虛假參考文獻的計劃震驚了科學家>( The citation black market: schemes selling fake references alarm scientists)指出,研究人員人為誇大參考計數的方式正在增加。(The ways in which researchers can artificially inflate their reference counts are growing.)科學家以 300 美元的價格從一家似乎大量出售虛假引文的公司購買了這些引文。團隊表示,這證實了研究誠信偵探長期以來一直猜測的偽造參考文獻黑市的存在。

從未被引用的科學

紐約大學 (NYU) 阿布達比分校的電腦科學家 Yasir Zaki 表示:「我們開始注意到一些 Google 學術搜尋個人資料的引用趨勢存在問題。」他的團隊在 2 月的預印本1中描述了其誘騙行動。 “當一篇手稿在發表後幾天內獲得數百次引用,或者當一位科學家的引用量突然大幅增加時,你就知道出了問題。”

這些做法很麻煩,因為研究人員職業生涯的許多方面都取決於他們的論文獲得多少參考文獻。許多機構使用引用次數來評估科學家,引用次數為h指數等指標提供信息,該指標旨在衡量學者的生產力及其研究的影響力。

引用操縱可能會產生真正的後果。 6 月,西班牙報紙El País報道稱,該國研究倫理委員會已敦促薩拉曼卡大學調查其新任命的校長胡安·曼努埃爾·科爾查多(Juan Manuel Corchado) 的工作,這位電腦科學家被指控人為提高其Google學術搜尋指標。 (科爾查多沒有回應《自然》雜誌的置評請求。)

出售參考資料

法國格勒諾布爾阿爾卑斯大學的電腦科學家西里爾·拉貝 (Cyril Labbé) 表示,研究誠信觀察者已經懷疑假論文工廠會出售引文,這些假論文工廠生產低品質的研究,並在已被接受的論文上出售作者名額。 「假論文工廠有能力在他們銷售的論文中插入引文,」他說。

2023 年 11 月,由於擔心引文遊戲和“過度出版”,位於賓夕法尼亞州費城的分析公司 Clarivate 將 1,000 多名研究人員從其年度高被引研究人員名單中排除。

在他們的誘騙行動中,札基和他的同事為一位虛構的科學家創建了谷歌學術檔案,並上傳了 20 項利用人工智慧創建的虛構研究。

隨後,該團隊聯繫了一家公司,他們在分析資料集中與其中一位作者相關的可疑引文時發現,該公司似乎正在向Google學術檔案出售引文。研究作者透過電子郵件聯繫該公司,隨後透過 WhatsApp 進行溝通。該公司提供 50 次引用的價格為 300 美元,或 100 次引用的價格為 500 美元。作者選擇了第一個選項,40 天后,來自 22 種期刊的 50 次引用(其中 14 種被學術資料庫 Scopus 索引)被添加到該虛構研究人員的 Google 學術檔案中。

該團隊沒有與《自然》雜誌分享該公司的名稱,理由是擔心披露該公司名稱可能會引起人們對其網站或他們創建的虛假谷歌學術個人資料的關注,因為這可能會洩露植入虛假引文的研究作者的身份。當被《自然》雜誌問及Google Scholar 是否意識到其網站上可以創建虛假個人資料時,該公司的傑出工程師Anurag Acharya 表示:「雖然學術不當行為是可能的,但這種情況很少見,因為所有方面都是可見的——索引的文章、由作者簡介、引用作者的文章、引用文章的託管位置等等。世界上任何人都可以打電話給你。

在另一個引用操縱的演示中,上個月,研究人員為一隻名叫 Larry 的貓創建了一個虛假的 Google Scholar 個人資料,其中列出了十幾篇以 Larry 為唯一作者的假論文。研究人員在學術社交網站 ResearchGate 上發布了十幾項引用拉里論文的無意義研究。拉里的身份被揭露大約一周後,谷歌學術刪除了這隻貓的研究、那些引用拉里的研究以及累積的引用。 ResearchGate 也刪除了引用拉里的虛假研究。

扎基和同事的誘騙行動源於評估虛假引文問題規模的更廣泛努力。他們使用軟體檢查了大約 160 萬份 Google 學術檔案,其中至少有 10 篇出版物。他們搜尋了被引用次數超過 200 次的個人資料,以及研究人員的引用次數每年增加 10 倍或更多的實例,或者這種增加代表其總引用次數至少增加了 25%。團隊發現了 1,016 個此類檔案。

打擊生產假科學的論文工廠

扎基說,這些簡介中對論文的許多引用都來自未經同行評審的預印本文章,它們通常列在論文的參考書目中,但不會在手稿的主體中引用。

「透過創建虛假預印本和付費服務,引文很容易被操縱,」合著者、紐約大學阿布達比分校電腦科學家塔拉勒·拉萬 (Talal Rahwan) 說。

作者還調查了在世界排名最高的 10 所大學工作的 574 名研究人員。他們發現,在評估科學家時考慮引用次數的大學中,超過 60% 的大學從 Google Scholar 取得這些數據。

腥味圖案

Labbé 並不相信該調查聲稱 Google Scholar 被廣泛用於獲取研究人員的引用指標。他說,過去曾出現過關於Google學術搜尋引文操縱的指控,學者們長期以來一直懷疑有供應商提供此類服務。但他表示,揭露引文賣家的誘捕行動尚屬首次。

法國圖盧茲大學的電腦科學家 Guillaume Cabanac 創建了一種工具,可以標記偽造的論文,這些論文中添加了奇怪的措辭,以規避抄襲檢測軟體。

Labbé 的團隊正在建立一種工具,可以自動標記可能指向操縱的可疑引用模式。

科學界的假論文問題有多嚴重?

為了解決這個問題,札基的團隊提出了一種稱為引用集中度指數的指標,旨在檢測科學家從少數來源獲得大量引用的情況。這種活動通常是「引用圈」的標誌,科學家同意互相引用以誇大彼此的指標。拉萬說:“可疑的文章往往會被來自少數幾個來源的大量引用。”

誠信偵探們擔心的一個問題是,詐欺者會想出更微妙的做法來避免被發現。例如,拉貝指出,避免被引文集中度指數檢測到的一種方法是一次購買一些引文,而不是大量購買。

對 Labbé 來說,解決引文遊戲問題的方法是改變學術界的激勵措施,這樣科學家就不會面臨為了發展職業生涯而積累盡可能多的引文的壓力。 「發表和引用的壓力不利於科學家的行為,」他說。

社群留言

台北旅遊新聞

台北旅遊新聞