Bart Ko Base
B
Bart Ko Base
cosmoquesterによって開発
多源韓国語データセットに基づいて事前学習されたBARTモデルで、様々な韓国語自然言語処理タスクに適用可能です。
ダウンロード数 50
リリース時間 : 3/2/2022
モデル概要
このモデルは複数の韓国語データセットを統合して事前学習され、口語と書き言葉のテキストに対する汎化能力が向上し、テキスト生成やテキスト補完などのタスクをサポートします。
モデル特徴
多源データ訓練
韓国国立国語院コーパス、AIhubプラットフォーム、世宗コーパスなどの複数の韓国語データセットを統合して訓練します。
口語と書き言葉の両立
口語会話と書き言葉のテキストを含む多様な訓練データを使用することで、モデルの異なる文体に対する性能が向上します。
TPU訓練の最適化
Google TPU研究クラウドプロジェクトによるコンピューティングパワーのサポートを受け、訓練効率が高いです。
モデル能力
テキスト生成
テキスト補完
自然言語推論
テキスト分類
意味的類似度計算
憎悪発言検出
使用事例
テキスト生成
会話生成
自然で流暢な韓国語会話を生成します。
チャットボットなどのアプリケーションに使用できます。
テキスト理解
感情分析
韓国語テキストの感情傾向を分析します。
NSMCテストセットで88.77%の正解率を達成しました。
意味的類似度計算
2つの韓国語テキストの意味的類似度を計算します。
KLUE意味的類似度開発セットでF1値が76.54%です。
コンテンツ審査
憎悪発言検出
韓国語テキスト内の憎悪発言や偏見的な内容を識別します。
偏見識別の正解率は82.80%、憎悪発言の正解率は56.69%です。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98