Voice Safety Classifier
WavLM base plusアーキテクチャに基づく音声コンテンツ安全検出モデルで、音声チャット内の有害コンテンツを識別
ダウンロード数 11.55k
リリース時間 : 6/28/2024
モデル概要
このモデルは、音声チャットオーディオ内の有害コンテンツ(悪質な言葉、性的コンテンツ、人種差別、いじめなど)を検出するための大規模分類モデルです。
モデル特徴
マルチラベル分類
悪質な言葉、性的コンテンツ、人種差別、いじめなど、音声内の複数の違反タイプを同時に検出可能
高精度
人手でラベル付けされたデータセットで94.48%の平均精度を達成
大規模トレーニングデータ
2,374時間の音声チャットオーディオクリップを使用して微調整
モデル能力
音声コンテンツ分類
有害コンテンツ検出
マルチラベル予測
使用事例
コンテンツセキュリティ
音声チャット監視
音声チャットプラットフォーム内の違反コンテンツをリアルタイムで監視
様々なタイプの違反音声コンテンツを効果的に識別可能
コミュニティ管理
潜在的に有害な音声コンテンツを自動的にフラグ付けし、人手審査に供する
人手審査作業を削減し、審査効率を向上
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98