bart-ko-base開源模型 - 適用於多種韓語自然語言處理任務，免費好用！

Bart Ko Base

由cosmoquester開發

基於多源韓語數據集預訓練的BART模型，適用於多種韓語自然語言處理任務

下載量 50

發布時間 : 3/2/2022

模型概述

該模型整合了多種韓語數據集進行預訓練，提升了在口語和書面語文本上的泛化能力，支持文本生成、文本補全等任務

多源數據訓練

整合了韓國國立國語院語料庫、AIhub平臺和世宗語料庫等多種韓語數據集進行訓練

口語書面語兼顧

通過包含口語對話和書面文本的多樣化訓練數據，提升了模型在不同語體上的表現

TPU訓練優化

由Google TPU研究雲計劃提供算力支持，訓練效率高

文本生成

文本補全

自然語言推理

文本分類

語義相似度計算

仇恨言論檢測

文本生成

對話生成

生成自然流暢的韓語對話

可用於聊天機器人等應用

文本理解

情感分析

分析韓語文本的情感傾向

在NSMC測試集上達到88.77%準確率

語義相似度計算

計算兩段韓語文本的語義相似度

在KLUE語義相似度開發集上F1值76.54%

內容審核

仇恨言論檢測

識別韓語文本中的仇恨言論和偏見內容

偏見識別準確率82.80%，仇恨言論準確率56.69%

數據集	KLUE NLI dev	NSMC test	QuestionPair test	KLUE TC dev	KLUE TC dev	KLUE STS dev	KLUE STS dev	KLUE STS dev	KorSTS dev	KorSTS dev	KorSTS dev	HateSpeech dev	HateSpeech dev
指標	Acc	Acc	Acc	Acc	F1	F1	Pearson	Spearman	F1	Pearson	Spearman	Bias Acc	Hate Acc
得分	0.7390	0.8877	0.9208	0.8667	0.8637	0.7654	0.8090	0.8040	0.8067	0.7909	0.7784	0.8280	0.5669