D

DA BERT Old News V1

Developed by CALDISS-AAU
首個基於丹麥專制時期(1660-1849年)歷史文本訓練的變壓器模型,由奧爾堡大學研究人員開發,用於處理與現代丹麥語差異較大的歷史文本語義。
Downloads 48
Release Time : 4/1/2025

Model Overview

基於MLM任務預訓練的BERT模型,專門針對丹麥專制時期的歷史文本進行優化,能夠更好地理解和處理這些與現代丹麥語有顯著差異的文本。

Model Features

歷史文本優化
專門針對丹麥專制時期(1660-1849年)的歷史文本進行訓練,能夠更好地捕捉與現代丹麥語差異較大的語義。
定製分詞器
使用定製WordPiece分詞器,優化對歷史文本的分詞效果。
高質量訓練數據
訓練數據來自ENO語料庫,包含1762至1848年間丹麥與挪威報紙的新聞、公告及廣告,單詞級錯誤率約為5%。

Model Capabilities

填充掩碼
歷史文本語義理解

Use Cases

歷史研究
歷史文本分析
用於分析丹麥專制時期的歷史文本,幫助研究人員理解當時的語言使用和社會背景。
歷史文獻翻譯輔助
輔助翻譯歷史文獻,提供更準確的語義理解。
語言學
語言演變研究
用於研究丹麥語從專制時期到現代的演變過程。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase