L

Llm Jp Modernbert Base

由 llm-jp 开发
基于modernBERT-base架构的日语大语言模型,支持最大8192的序列长度,使用3.4TB日语语料训练
下载量 1,398
发布时间 : 4/25/2025

模型简介

该模型是针对日语优化的BERT变体,采用modernBERT架构和llm-jp-tokenizer分词器,适用于日语文本理解和生成任务

模型特点

长上下文支持
支持最大8192的序列长度,适合处理长文本
大规模训练数据
使用llm-jp-corpus v4的日语子集(3.4TB)进行训练
优化的分词器
采用llm-jp-tokenizer分词器,专门针对日语文本优化

模型能力

日语文本理解
掩码语言预测
长文本处理

使用案例

自然语言处理
日语文本补全
预测文本中的掩码部分
示例中正确预测'日本の首都は東京です'中的'東京'
日语文本分类
可用于情感分析、主题分类等任务
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase