ArcheoBERTje開源考古模型 - 免費部署精準處理荷蘭語考古發掘報告

首頁

Archeobertje

由alexbrandsen開發

ArcheoBERTje 是一個面向考古學領域的荷蘭語 BERT 模型，基於 BERTje 模型進一步微調，專門用於處理荷蘭語考古發掘報告。

大型語言模型 #荷蘭語考古文本 #發掘報告分析 #領域微調BERT

下載量 18

發布時間 : 3/2/2022

模型概述

該模型基於荷蘭語 BERTje 模型，使用約 6 萬份荷蘭語發掘報告（約 6.5 億詞元）的語料庫進行微調，適用於考古學領域的自然語言處理任務。

模型特點

考古學領域專用

針對考古學領域的荷蘭語文本進行了優化，能夠更好地理解和處理考古發掘報告中的專業術語和上下文。

基於 BERTje 微調

基於荷蘭語 BERTje 模型進行微調，繼承了其優秀的荷蘭語處理能力，並進一步適應考古學領域的需求。

大規模訓練數據

使用了約 6 萬份荷蘭語發掘報告（約 6.5 億詞元）的語料庫進行訓練，覆蓋廣泛的考古學內容。

模型能力

文本分類

命名實體識別

文本生成

語義理解

使用案例

考古學研究

考古報告自動分類

自動對考古發掘報告進行分類，便於研究人員快速檢索和分析。

考古實體識別

識別報告中的考古學術語、地名、文物名稱等實體，輔助研究分析。

文化遺產管理

文化遺產文檔處理

自動化處理文化遺產相關的文檔，提高管理效率。

屬性	詳情
模型類型	適用於考古領域的荷蘭語BERT模型
訓練數據	來自DANS數據存檔庫（https://easy.dans.knaw.nl/ui/home）的約60000份荷蘭語考古發掘報告（約6.5億個標記）

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Archeobertje

模型概述

模型特點

模型能力

使用案例

🚀 ArcheoBERTje

🚀 快速開始

模型基礎信息

模型來源