M

Morphbert Large Morpheme Segmentation Ru

CrabInHoneyによって開発
Transformerアーキテクチャに基づく大規模ロシア語形態素分割モデルで、ロシア語単語の各文字を25種類の形態素カテゴリのいずれかに分類可能
ダウンロード数 16
リリース時間 : 4/7/2025

モデル概要

このモデルはロシア語単語の形態素分割タスクに特化してファインチューニングされており、ロシア語単語の構成形態素を解析でき、文字レベルの形態解析予測に適用可能です。

モデル特徴

高精度形態素分割
評価データセットで約0.99の文字レベル精度を達成し、ロシア語単語の形態素境界を正確に識別可能。
豊富な形態素カテゴリ
語根、接頭辞、接尾辞、連結子など25種類の形態構造分類をサポート。
大規模Transformerアーキテクチャ
bert-base相当の複雑なアーキテクチャを採用し、小型版より高い解析精度を実現。

モデル能力

ロシア語単語形態素分割
文字レベルタグ分類
形態解析予測

使用事例

言語学分析
ロシア語単語形態分解
ロシア語単語を語根、接頭辞、接尾辞などの形態素成分に分解
例:'масляный'を'масл:ROOT / ян:SUFF / ый:END'に分解
複合語分析
ハイフンを含む複合語構造を解析
例:'сине-белый'を'син:ROOT / е:LINK / -:HYPH / бел:ROOT1 / ый:END'に分解
自然言語処理
ロシア語NLP前処理
ロシア語NLPタスクに単語形態構造情報を提供
語形還元、語幹抽出などの下流タスクに利用可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase