AI內容安全再進化 ditto--ai推4B模型即時辨識多語言不良資訊
商傳媒/[email protected] (商傳媒 SUN MEDIA)
63 天前

商傳媒|責任編輯/綜合外電報導
人工智慧(AI)安全與內容審核領域迎來新突破。新創公司 ditto--ai 近期推出一款名為「qwen3guard-gen-4b」的 AI 安全模型,該模型擁有 40 億參數,專為高效能內容分類設計,能將 AI 內容區分為「安全」、「不安全」或「具爭議性」三大類別。
這款 qwen3guard-gen-4b 模型具備支援全球 119 種語言的審核能力,可有效運用於多語系環境中。相較於現有大型替代方案,例如 Llama-Guard-3-8B,其較小的 40 億參數規模,能在維持強大分類效能的同時,實現更快的推論速度,對於需要即時內容審核的高流量系統而言,具備極高的實用性。
ditto--ai 表示,qwen3guard-gen-4b 模型採用獨特的雙輸入能力,不僅能審核使用者的指令(prompt),也能同時監控 AI 助理的回應(response)。透過此功能,模型能偵測內容是否觸發 AI 助理的拒絕模式,並提供詳細的內容分類資訊,確保人工智慧系統的安全性與合規性。
該模型應用範圍廣泛,可協助社群平台、聊天應用程式及 AI 服務提供商,在內容發布前進行篩選,以減少有害資訊的傳播。此外,企業可將其整合至客服聊天機器人,預先過濾不安全的指令,並監控模型產出的內容,有效維護服務品質與用戶安全。該模型亦可用於現有對話的稽核,或建立跨用戶互動的安全報告,對於提升 AI 應用的內容安全標準至關重要。
相關新聞
大型語言模型面臨「焦油坑」威脅 AI投毒恐致輸出失準
商傳媒
1 天前
AI模型高效辨識軟體漏洞 專家警示:缺人類輸入恐陷「模型崩潰」
商傳媒
3 天前
Google Search 整合 AI 圖像辨識 用戶可查生成內容來源
商傳媒
5 天前
Anthropic 發表 AI 工具 洞悉 Claude 模型思維
商傳媒
3 天前
底特律房產奇蹟:女子低價購置八處不良資產 專家揭另類投資術
商傳媒
1 天前
TestMu AI擴展真實裝置測試能力,新增多語言Playwright支援與iOS進階音訊測試功能
中央社
5 天前
對抗AI內容竊取 百年「熱點新聞」原則重獲關注
商傳媒
1 天前
白內障手術再進化,眼科權威名醫:邁入精準AI醫療新時代
火報
3 天前
Anthropic推法律AI工具新方案 資安模型Claude Mythos擴大開放合作
商傳媒
1 天前
開發者運用 Docker 部署 LiteLLM,統一管理逾百種 AI 模型
商傳媒
2 天前
Google 推 TurboQuant AI 演算法 資料中心能耗有望大幅降低
商傳媒
1 天前
AI地球觀測新里程碑 IBM與NASA模型升空強化災害預警
商傳媒
3 天前
AI協作助手改變商務會議生態 提升資訊整合與即時互動
商傳媒
3 天前
DigitalOcean 導入 Kimi K2.6 模型 改寫 AI 雲端計價模式
商傳媒
4 天前