Jailbreak Classifier
J
Jailbreak Classifier
jackhhaoによって開発
bert-base-uncasedをファインチューニングしたテキスト分類モデルで、ユーザープロンプト内のジェイルブレーク試行を検出するために使用されます
ダウンロード数 7,619
リリース時間 : 9/30/2023
モデル概要
このモデルはコンテンツ審査シナリオ専用に設計されており、ユーザープロンプトをジェイルブレーク試行または良性リクエストに分類し、AIシステムの安全性を維持するのに役立ちます。
モデル特徴
ジェイルブレーク検出
ユーザープロンプト内のジェイルブレーク試行を正確に識別し、AIシステムを悪意ある攻撃から保護します
BERTベース
bert-base-uncasedをファインチューニングしており、BERTの強力なテキスト理解能力を継承しています
コンテンツ審査
AIシステムのコンテンツ審査シナリオ向けに最適化されており、システムの安全性維持を支援します
モデル能力
テキスト分類
ジェイルブレーク検出
コンテンツ審査
プロンプトインジェクション識別
使用事例
AIセキュリティ
チャットボット保護
チャットボットに対するユーザーのジェイルブレーク試行を検出します
悪意あるプロンプトインジェクションを効果的に阻止します
コンテンツ審査システム
AIシステムの最初の防衛線として悪意あるリクエストをフィルタリングします
システムの安全性を向上させます
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98