mdeberta-v3-base-prompt-injectionオープンソースモデル - 悪意なプロンプト注入攻撃を検出し、情報セキュリティを保障

ホーム

Mdeberta V3 Base Prompt Injection

proventraによって開発

microsoft/mdeberta-v3-baseをファインチューニングしたプロンプトインジェクション検出モデルで、複数のデータセットを統合してトレーニングされ、悪意のあるプロンプトインジェクション攻撃を識別します。

テキスト分類

Transformers

オープンソースライセンス:MIT #プロンプトインジェクション検出 #マルチソーストレーニングデータ #大規模言語モデルセキュリティ

ダウンロード数 136

リリース時間 : 4/10/2025

モデル概要

このモデルは大規模言語モデルにおけるプロンプトインジェクション攻撃を検出するために特別に設計されており、正当なコンテンツに埋め込まれた悪意のある命令を識別し、AIシステムの安全性を保護します。

モデル特徴

マルチソースデータトレーニング

公開データセットとカスタムデータセットを統合し、さまざまなインジェクション攻撃パターンをカバーします

ネスト化コンテンツ検出

正当なウェブサイトコンテンツや記事に隠された悪意のある命令を識別できます

軽量デプロイ

高性能なmDeBERTa-v3アーキテクチャに基づき、検出精度と推論速度のバランスを取ります

モデル能力

テキストセキュリティ分析

悪意のある命令識別

多言語インジェクション検出

使用事例

AIセキュリティ保護

チャットボット保護

ユーザーが巧妙に設計したプロンプトでAIのセキュリティ制限を回避するのを防止します

テストデータに基づき、既知のインジェクションパターンの90%以上を効果的にブロックします

APIセキュリティゲートウェイ

AIサービスAPIのフロントエンドに検知層を展開します

悪意のあるリクエストをリアルタイムでブロックします

コンテンツモデレーション

ユーザー生成コンテンツスクリーニング

フォーラム/コミュニティでAIを誘導しようとする隠れた命令を検出します

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Mdeberta V3 Base Prompt Injection

モデル概要

モデル特徴

モデル能力

使用事例

🚀 mdeberta-v3-base-prompt-injection

🚀 クイックスタート

💻 使用例

基本的な使用法

Proventra Coreでの使用

📄 ライセンス

情報テーブル