M

Meta Llama Guard 2 8B

由meta-llama開發
基於80億參數Llama 3的安全防護模型,用於對LLM輸入和響應進行安全分類
下載量 12.85k
發布時間 : 4/17/2024

模型概述

Llama Guard 2是基於Llama 3的安全防護模型,可用於對LLM輸入(提示分類)和LLM響應(響應分類)中的內容進行分類,識別潛在危害內容。

模型特點

安全分類
可對LLM輸入和響應進行安全分類,識別潛在危害內容
多類別檢測
基於MLCommons危害分類標準,可檢測11種不同類別的危害內容
概率評分
通過分析第一個標記的概率生成分類器分數,可設置閾值進行二元決策

模型能力

文本分類
內容安全檢測
危害內容識別

使用案例

內容安全
LLM輸入過濾
檢測用戶輸入中是否包含有害內容
防止有害內容進入LLM處理流程
LLM響應過濾
檢測LLM生成的響應中是否包含有害內容
確保LLM輸出符合安全標準
合規監控
合規性檢查
確保LLM交互符合法律法規和平臺政策
降低法律和聲譽風險
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase