R

Robeczech Base

ufalによって開発
RobeCzechはチェコ語データを基に訓練された単言語RoBERTa言語表現モデルで、チェコのチャールズ大学の形式・応用言語学部によって開発されました。
ダウンロード数 2,911
リリース時間 : 3/2/2022

モデル概要

このモデルは主に穴埋め予測タスクに使用され、チェコ語テキスト処理をサポートし、様々な自然言語処理タスクに適しています。

モデル特徴

改良された形態素解析器
バージョン1.1では形態素解析器に重要な改良が加えられ、番号の欠落を埋め、すべてのトークンに一意のIDを割り当て、モデルの安定性と互換性を向上させました。
チェコ語最適化
チェコ語データを対象に特別に訓練され、言語表現能力が最適化され、チェコ語関連の自然言語処理タスクに適しています。
文書構造の保持
訓練時に文書の完全な構造を保持することで、モデルが文脈情報を理解するのに役立ちます。

モデル能力

穴埋め予測
形態素ラベリング
見出し語化
依存構文解析
固有表現抽出
意味解析

使用事例

自然言語処理
形態解析と見出し語化
凍結された単語埋め込みを使用してチェコ語の形態解析と見出し語化を行います。
タグ付けの正解率は98.50(品詞タグ付け)と91.42(細粒度品詞)
固有表現抽出
チェコ語テキスト中の固有表現を識別します。
F1値は87.82(ネスト)と87.47(フラット)
意味解析
チェコ語テキストに対して意味解析を行います。
平均F1値は92.36
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase