roberta-base-coldオープンソース中国語攻撃的言語検出モデル - ネット上の不適切な用語を高精度で識別

ホーム

Roberta Base Cold

thu-coaiによって開発

hfl/chinese-roberta-wwm-extモデルをCOLDatasetで微調整した中国語の冒とく的言語検出モデル

テキスト分類

Transformers

中国語#中国語の冒とく性検出 #高精度 #ソーシャルメディア分析

ダウンロード数 410

リリース時間 : 11/2/2022

モデル概要

このモデルは中国語テキスト内の冒とく的コンテンツを検出するために特別に設計されており、ヘイトスピーチや差別的言語などの不適切なコンテンツを識別できます。

モデル特徴

中国語冒とく的言語検出

中国語テキスト向けに特別に設計された冒とく的コンテンツ識別能力

RoBERTa-wwm-extアーキテクチャ採用

全単語マスキング技術を用いた堅牢な事前学習モデル

COLDatasetで微調整

専門的な中国語冒とく的言語データセットを使用して最適化

モデル能力

中国語テキスト分類

冒とく的コンテンツ識別

ヘイトスピーチ検出

差別的言語識別

使用事例

コンテンツモデレーション

ソーシャルメディアコンテンツフィルタリング

ソーシャルメディア上の冒とく的発言を自動識別・フィルタリング

プラットフォームが健全な議論環境を維持するのを支援

オンラインコミュニティ管理

フォーラムやコメント欄の不適切な発言を検出

手動審査作業量の削減

教育研究

言語行動研究

ネットワーク言語における冒とく的パターンの分析

社会学研究にデータサポートを提供

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Roberta Base Cold

モデル概要

モデル特徴

モデル能力

使用事例

🚀 [hfl/chinese - roberta - wwm - extをCOLDatasetでファインチューニングしたモデル]

🚀 クイックスタート

💻 使用例

基本的な使用法