L

Llm Jp Modernbert Base

由llm-jp開發
基於modernBERT-base架構的日語大語言模型,支持最大8192的序列長度,使用3.4TB日語語料訓練
下載量 1,398
發布時間 : 4/25/2025

模型概述

該模型是針對日語優化的BERT變體,採用modernBERT架構和llm-jp-tokenizer分詞器,適用於日語文本理解和生成任務

模型特點

長上下文支持
支持最大8192的序列長度,適合處理長文本
大規模訓練數據
使用llm-jp-corpus v4的日語子集(3.4TB)進行訓練
優化的分詞器
採用llm-jp-tokenizer分詞器,專門針對日語文本優化

模型能力

日語文本理解
掩碼語言預測
長文本處理

使用案例

自然語言處理
日語文本補全
預測文本中的掩碼部分
示例中正確預測'日本の首都は東京です'中的'東京'
日語文本分類
可用於情感分析、主題分類等任務
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase