AI內容安全再進化 ditto--ai推4B模型即時辨識多語言不良資訊

商傳媒

商傳媒/[email protected] (商傳媒 SUN MEDIA)

63 天前

商傳媒｜責任編輯／綜合外電報導

人工智慧（AI）安全與內容審核領域迎來新突破。新創公司 ditto--ai 近期推出一款名為「qwen3guard-gen-4b」的 AI 安全模型，該模型擁有 40 億參數，專為高效能內容分類設計，能將 AI 內容區分為「安全」、「不安全」或「具爭議性」三大類別。

這款 qwen3guard-gen-4b 模型具備支援全球 119 種語言的審核能力，可有效運用於多語系環境中。相較於現有大型替代方案，例如 Llama-Guard-3-8B，其較小的 40 億參數規模，能在維持強大分類效能的同時，實現更快的推論速度，對於需要即時內容審核的高流量系統而言，具備極高的實用性。

ditto--ai 表示，qwen3guard-gen-4b 模型採用獨特的雙輸入能力，不僅能審核使用者的指令（prompt），也能同時監控 AI 助理的回應（response）。透過此功能，模型能偵測內容是否觸發 AI 助理的拒絕模式，並提供詳細的內容分類資訊，確保人工智慧系統的安全性與合規性。

該模型應用範圍廣泛，可協助社群平台、聊天應用程式及 AI 服務提供商，在內容發布前進行篩選，以減少有害資訊的傳播。此外，企業可將其整合至客服聊天機器人，預先過濾不安全的指令，並監控模型產出的內容，有效維護服務品質與用戶安全。該模型亦可用於現有對話的稽核，或建立跨用戶互動的安全報告，對於提升 AI 應用的內容安全標準至關重要。

AI內容安全再進化 ditto--ai推4B模型即時辨識多語言不良資訊

相關新聞

大型語言模型面臨「焦油坑」威脅 AI投毒恐致輸出失準

AI模型高效辨識軟體漏洞專家警示：缺人類輸入恐陷「模型崩潰」

Google Search 整合 AI 圖像辨識用戶可查生成內容來源

Anthropic 發表 AI 工具洞悉 Claude 模型思維

底特律房產奇蹟：女子低價購置八處不良資產專家揭另類投資術

TestMu AI擴展真實裝置測試能力，新增多語言Playwright支援與iOS進階音訊測試功能

對抗AI內容竊取百年「熱點新聞」原則重獲關注

白內障手術再進化，眼科權威名醫：邁入精準AI醫療新時代

Anthropic推法律AI工具新方案資安模型Claude Mythos擴大開放合作

開發者運用 Docker 部署 LiteLLM，統一管理逾百種 AI 模型

Google 推 TurboQuant AI 演算法資料中心能耗有望大幅降低

AI地球觀測新里程碑 IBM與NASA模型升空強化災害預警

AI協作助手改變商務會議生態提升資訊整合與即時互動

DigitalOcean 導入 Kimi K2.6 模型改寫 AI 雲端計價模式

AI內容安全再進化 ditto--ai推4B模型即時辨識多語言不良資訊

相關新聞

大型語言模型面臨「焦油坑」威脅 AI投毒恐致輸出失準

AI模型高效辨識軟體漏洞 專家警示：缺人類輸入恐陷「模型崩潰」

Google Search 整合 AI 圖像辨識 用戶可查生成內容來源

Anthropic 發表 AI 工具 洞悉 Claude 模型思維

底特律房產奇蹟：女子低價購置八處不良資產 專家揭另類投資術

TestMu AI擴展真實裝置測試能力，新增多語言Playwright支援與iOS進階音訊測試功能

對抗AI內容竊取 百年「熱點新聞」原則重獲關注

白內障手術再進化，眼科權威名醫：邁入精準AI醫療新時代

Anthropic推法律AI工具新方案 資安模型Claude Mythos擴大開放合作

開發者運用 Docker 部署 LiteLLM，統一管理逾百種 AI 模型

Google 推 TurboQuant AI 演算法 資料中心能耗有望大幅降低

AI地球觀測新里程碑 IBM與NASA模型升空強化災害預警

AI協作助手改變商務會議生態 提升資訊整合與即時互動

DigitalOcean 導入 Kimi K2.6 模型 改寫 AI 雲端計價模式

AI模型高效辨識軟體漏洞專家警示：缺人類輸入恐陷「模型崩潰」

Google Search 整合 AI 圖像辨識用戶可查生成內容來源

Anthropic 發表 AI 工具洞悉 Claude 模型思維

底特律房產奇蹟：女子低價購置八處不良資產專家揭另類投資術

對抗AI內容竊取百年「熱點新聞」原則重獲關注

Anthropic推法律AI工具新方案資安模型Claude Mythos擴大開放合作

Google 推 TurboQuant AI 演算法資料中心能耗有望大幅降低

AI協作助手改變商務會議生態提升資訊整合與即時互動

DigitalOcean 導入 Kimi K2.6 模型改寫 AI 雲端計價模式