M

Morphbert Large Morpheme Segmentation Ru

由CrabInHoney開發
基於Transformer架構的大型俄語語素分割模型,可將俄語單詞的每個字符分類為25種語素類別之一
下載量 16
發布時間 : 4/7/2025

模型概述

該模型專門針對俄語詞語素分割任務進行微調,能夠解析俄語單詞的構成語素,適用於字符級別的形態分析預測。

模型特點

高精度語素分割
在評估數據集上達到約0.99的字符級準確率,能夠準確識別俄語單詞的語素邊界。
豐富的語素類別
支持25種語素類別分類,包括詞根、前綴、後綴、連接符等多種形態結構。
大型Transformer架構
採用與bert-base相當的複雜架構,比小型版本具有更高的解析準確度。

模型能力

俄語單詞語素分割
字符級標記分類
形態分析預測

使用案例

語言學分析
俄語單詞形態分解
將俄語單詞分解為詞根、前綴、後綴等語素成分
例如將'масляный'分解為'масл:ROOT / ян:SUFF / ый:END'
複合詞分析
解析包含連字符的複合詞結構
例如將'сине-белый'分解為'син:ROOT / е:LINK / -:HYPH / бел:ROOT1 / ый:END'
自然語言處理
俄語NLP預處理
為俄語NLP任務提供單詞形態結構信息
可用於詞形還原、詞幹提取等下游任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase