G

Guardreasoner 8B

yueliu1999によって開発
GuardReasoner 8Bはmeta-llama/Llama-3.1-8Bをファインチューニングしたモデルで、推論型LLMセキュリティ保護に特化
ダウンロード数 480
リリース時間 : 1/30/2025

モデル概要

このモデルはR-SFTとHS-DPOファインチューニング技術を用いて、人間とAIのインタラクションの安全性分析、有害性検出や拒否検出などのタスクを実行

モデル特徴

推論型セキュリティ保護
段階的推論方式でAIインタラクションを分析し、判断と推論プロセスの一貫性を確保
マルチタスク連合検出
プロンプト有害性検出、拒否検出、レスポンス有害性検出の3タスクを同時実行
効率的なファインチューニング技術
R-SFTやHS-DPOなどの先進的ファインチューニング手法でモデル性能を最適化

モデル能力

テキスト分類
有害コンテンツ検出
AIレスポンス評価
マルチタスク推論

使用事例

AIセキュリティ監視
ソーシャルメディアコンテンツ審査
ユーザーとAIのインタラクションにおける有害コンテンツや不適切なレスポンスを検出
潜在的有害インタラクションを正確に識別しセキュリティ評価を提供
AIアシスタントセキュリティ保護
AIアシスタントのレスポンスが安全基準に準拠しているかを監視
AIが有害リクエストに従うか拒否するかを効果的に検出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase