L

Llama Guard 3 8B INT8

由meta-llama開發
基於Llama-3.1-8B微調的內容安全分類模型,支持8種語言的輸入/響應內容審核
下載量 4,165
發布時間 : 7/21/2024

模型概述

用於大語言模型(LLM)輸入提示和生成響應的安全分類,可識別14類違規內容並支持多語言審核

模型特點

多場景分類
可同時處理LLM輸入提示和生成響應的安全審核
多語言支持
支持8種語言的內容安全審核
特定場景優化
針對搜索和代碼解釋器工具調用的安全防護特別優化
精細分類體系
基於MLCommons標準識別14類危害內容

模型能力

提示內容安全分類
響應內容安全審核
多語言內容審核
違規類別識別
代碼解釋器濫用檢測

使用案例

內容安全
聊天機器人內容過濾
檢測用戶輸入和AI響應中的違規內容
輸出安全評級及具體違規類別
代碼解釋器防護
識別潛在的惡意代碼執行請求
阻止容器逃逸等攻擊嘗試
多語言審核
國際化內容審核
支持8種語言的違規內容檢測
統一處理多語言用戶生成內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase