G

Granite Guardian 3.2 5b

ibm-graniteによって開発
花崗岩ガーディアン3.2は3.1バージョンを基に簡素化したリスク検出モデルで、反復プルーニング技術によりより効率的な推論を実現し、プロンプトとレスポンスにおける多次元リスクの識別に特化しています。
ダウンロード数 799
リリース時間 : 1/23/2025

モデル概要

このモデルはAIインタラクションにおける様々なリスク(コンテンツセキュリティ、RAG幻覚、エージェントワークフローリスクなど)を検出するために設計されており、IBM AIリスクマップで定義された多次元評価をサポートします。

モデル特徴

反復プルーニング技術
元のパラメータの30%を削除することで性能を維持しつつ推論速度を向上
多次元リスク検出
有害コンテンツ、RAG幻覚、エージェントワークフローリスクの包括的評価をサポート
標準化リスク評価
IBM AIリスクマップで定義された標準評価フレームワークを採用

モデル能力

コンテンツセキュリティ検出
RAGプロセス評価
エージェント関数呼び出し検証
マルチターン対話リスク分析

使用事例

コンテンツセキュリティ
有害コンテンツフィルタリング
ユーザー入力やモデル出力における暴力、差別などの有害コンテンツを検出
Aegisセキュリティテストセットで0.88 F1スコアを達成
RAG品質保証
事実根拠性検証
生成コンテンツと検索コンテキストの一貫性を評価
TRUEベンチマークテストで平均AUC 0.84を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase