G

Granite 3.1 1b A400m Base

由ibm-granite開發
Granite-3.1-1B-A400M-Base 是 IBM 開發的一款語言模型,通過漸進式訓練策略將上下文長度從4K擴展到128K,支持多語言和多種文本處理任務。
下載量 3,299
發布時間 : 12/6/2024

模型概述

該模型主要用於文本生成、摘要、分類、提取和問答等多種任務,支持12種語言,採用稀疏專家混合(MoE)Transformer架構。

模型特點

長上下文支持
通過漸進式訓練策略,將上下文長度從4K擴展到128K。
多語言支持
支持12種語言,包括英語、中文、日語等。
稀疏專家混合架構
採用MoE架構,包含細粒度專家、無丟棄令牌路由和負載均衡損失。

模型能力

文本生成
文本摘要
文本分類
信息提取
問答系統

使用案例

文本處理
問答系統
回答用戶提出的問題,如'Thomas J. Watson Research Center位於哪裡?'
生成準確的答案
文本摘要
對長文本進行摘要,提取關鍵信息
生成簡潔的摘要
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase