dbert開源韓語預訓練語言模型 - 免費支持各類韓語文本處理任務

首頁

Dbert

由baikalai開發

基於BERT架構的韓語預訓練語言模型，適用於韓語文本處理任務。

大型語言模型

Transformers

韓語#韓語BERT #維基百科訓練 #新聞文本處理

下載量 17

發布時間 : 3/2/2022

模型概述

deeqBERT基礎版是一個基於BERT架構的韓語預訓練語言模型，主要用於韓語文本的理解和生成任務。它支持韓國維基百科和新聞數據集的訓練，適用於多種自然語言處理應用。

模型特點

韓語優化

專門針對韓語文本進行優化，支持韓國維基百科和新聞數據集。

BERT分詞

使用BERT分詞器，詞彙表包含35k詞條，適合韓語文本處理。

預訓練模型

基於大規模韓語語料庫進行預訓練，具備強大的語言理解能力。

模型能力

文本分類

命名實體識別

問答系統

文本生成

語義相似度計算

使用案例

自然語言處理

韓語新聞分類

對韓語新聞文章進行分類，如政治、經濟、體育等類別。

高準確率的分類效果

韓語命名實體識別

識別韓語文本中的人名、地名、組織機構名等實體。

精準的實體識別能力

信息檢索

韓語問答系統

構建基於韓語的自動問答系統，回答用戶提出的問題。

高效的問答匹配

屬性	詳情
訓練數據	kowiki、新聞

屬性	詳情
模型類型	bert-base
詞表	bert-wordpiece，35k
版本	最新版

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Dbert

模型概述

模型特點

模型能力

使用案例

🚀 deeqBERT-base

📚 詳細文檔

數據集信息

模型信息