G

Granite 3.1 1b A400m Base

由 ibm-granite 开发
Granite-3.1-1B-A400M-Base 是 IBM 开发的一款语言模型,通过渐进式训练策略将上下文长度从4K扩展到128K,支持多语言和多种文本处理任务。
下载量 3,299
发布时间 : 12/6/2024

模型简介

该模型主要用于文本生成、摘要、分类、提取和问答等多种任务,支持12种语言,采用稀疏专家混合(MoE)Transformer架构。

模型特点

长上下文支持
通过渐进式训练策略,将上下文长度从4K扩展到128K。
多语言支持
支持12种语言,包括英语、中文、日语等。
稀疏专家混合架构
采用MoE架构,包含细粒度专家、无丢弃令牌路由和负载均衡损失。

模型能力

文本生成
文本摘要
文本分类
信息提取
问答系统

使用案例

文本处理
问答系统
回答用户提出的问题,如'Thomas J. Watson Research Center位于哪里?'
生成准确的答案
文本摘要
对长文本进行摘要,提取关键信息
生成简洁的摘要
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase