T

Thinkguard

Rakancorle1によって開発
ThinkGuard は、慎重なスロー思考を通じて安全分類能力を強化する先進的なガードレールモデルです。
ダウンロード数 23
リリース時間 : 2/25/2025

モデル概要

ThinkGuard は LLaMA-Guard-3-8B を微調整し、構造化批評を活用して安全推論を改善しながら計算効率を維持します。複数の危害カテゴリにわたって正確な安全分類を行い、安全評価をサポートする構造化批評を提供します。

モデル特徴

複数危害カテゴリにわたる正確な安全分類
様々な安全リスクカテゴリを識別し、精密な分類結果を提供します。
構造化批評
安全評価のための説明根拠を提供し、意思決定の透明性と説明可能性を強化します。
拡張性と効率性
実際の展開に適しており、計算効率を維持しながら安全分類能力を向上させます。

モデル能力

安全分類
構造化批評
多カテゴリリスク識別

使用事例

コンテンツセキュリティ審査
会話内容の安全評価
会話内のエージェントメッセージに安全でない内容が含まれているか評価し、違反カテゴリリストを提供します。
安全評価結果と違反カテゴリを出力し、コンテンツ審査の透明性と正確性を強化します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase