B

Bert Base Han Chinese Ws

由ckiplab開發
該模型為古代漢語提供分詞功能,訓練數據集涵蓋漢語發展的四個歷史時期。
下載量 14
發布時間 : 7/1/2022

模型概述

基於BERT架構的中文分詞模型,專門針對古代漢語文本設計,支持從上古到現代的漢語分詞任務。

模型特點

歷史漢語支持
訓練數據涵蓋上古、中古、近代和現代四個漢語發展時期
學術級語料
基於中央研究院語言學研究所的權威標註語料庫訓練
BERT架構
採用BERT-base架構,具有良好的上下文理解能力

模型能力

中文分詞
歷史漢語處理
序列標註

使用案例

學術研究
古代文獻分析
對上古漢語文獻進行自動分詞處理
可準確識別古代漢語中的詞語邊界
語言演變研究
比較不同歷史時期的漢語分詞特徵
幫助語言學家研究漢語的歷史演變
數字人文
古籍數字化
為古籍文本數字化提供預處理支持
提高古籍文本的可檢索性和分析性
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase