T

Transformers Ud Japanese Electra Base Ginza 510

由megagonlabs開發
基於ELECTRA架構的日語預訓練模型,使用mC4數據集約2億句日語文本預訓練,並在UD_日語_BCCWJ語料上微調
下載量 7,757
發布時間 : 3/2/2022

模型概述

這是一個日語自然語言處理模型,基於ELECTRA架構,專門針對日語文本進行優化,能夠識別日語文節結構。

模型特點

基於大規模日語語料訓練
使用mC4數據集中約2億句日語文本進行預訓練
專業領域微調
在UD_日語_BCCWJ語料上進行微調,優化了日語依存句法分析能力
與GiNZA集成
可與GiNZA v5配合使用,提供完整的日語NLP處理能力

模型能力

日語文本分析
依存句法分析
文節結構識別

使用案例

自然語言處理
日語文本解析
分析日語句子的結構和依存關係
準確識別日語文節結構
日語NLP應用開發
作為日語NLP應用的基礎模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase