C

Czert B Base Cased

UWB-AIRによって開発
CZERTはチェコ語に特化して訓練されたBERTに類似した言語表現モデルで、複数のチェコ語NLPタスクで多言語BERTモデルよりも優れた性能を発揮します。
ダウンロード数 560
リリース時間 : 3/2/2022

モデル概要

CZERTはBERTアーキテクチャに基づくチェコ語の事前学習言語モデルで、基礎版(CZERT - B)とALBERT版(CZERT - A)の2つのバリエーションがあり、感情分析、意味類似度、固有表現抽出などのタスクで優れた性能を発揮します。

モデル特徴

チェコ語最適化
チェコ語に特化して訓練されており、多言語BERTよりもチェコ語タスクで優れた性能を発揮します。
マルチタスク対応
トークンレベルからドキュメントレベルまでの複数のNLPタスクをサポートします。
性能卓越
複数のチェコ語NLPベンチマークテストでmBERTやSlavicBERTなどのモデルを上回っています。

モデル能力

テキスト分類
意味類似度計算
固有表現抽出
形態標注
意味役割標注
感情分析

使用事例

感情分析
ソーシャルメディアコメントの感情分類
FacebookやCSFD(チェコ映画データベース)のコメントの感情傾向を分析します。
CSFDデータセットで84.79%のF1スコアを達成しました。
意味理解
ニューステキストの類似度計算
チェコ通信社(CNA)のテキストの意味類似度を評価します。
ピアソン相関係数が84.345に達しました。
情報抽出
固有表現抽出
テキストからチェコ語の人名、地名などのエンティティを識別します。
CNECデータセットで86.274%のF1スコアを達成しました。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase