R

Roberta Classical Chinese Base Sentence Segmentation

由KoichiYasuoka開發
這是一個基於文言文預訓練的RoBERTa模型,專門用於句子分割任務,能夠自動識別文言文中的句子邊界。
下載量 34
發布時間 : 3/2/2022

模型概述

該模型用於文言文文本的句子分割任務,能夠自動識別文言文中的句子邊界。每個分割後的句子以標記類別'B'開頭,以'E'結尾(單字符句子則使用標記類別'S')。

模型特點

文言文專用
專門針對文言文預訓練和優化,能夠準確識別文言文中的句子邊界。
基於RoBERTa架構
採用RoBERTa架構,具有強大的上下文理解能力。
標記分類
使用B/E/S標記系統來標識句子邊界,適用於複雜的文言文結構。

模型能力

文言文處理
句子分割
文本標記分類

使用案例

古籍數字化
古籍文本自動分段
對古籍文獻進行自動句子分割,便於後續分析和處理。
準確識別文言文句子邊界
文言文教學
教學材料預處理
自動分割文言文教材中的句子,便於教學使用。
提高教學材料準備效率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase