P

Plamo 2 8b

由pfnet開發
PLaMo 2 8B是由Preferred Elements公司開發的80億參數混合架構語言模型,支持英語和日語文本生成。
下載量 401
發布時間 : 2/7/2025

模型概述

基於英語和日語數據集預訓練的大規模語言基礎模型,採用類似Samba的混合架構(結合選擇性狀態空間模型與滑動窗口注意力機制),專注於高效文本生成。

模型特點

高效混合架構
整合Mamba2選擇性狀態空間模型與滑動窗口注意力機制,相比傳統Transformer具有更高計算效率
雙語支持
針對英語和日語優化,訓練數據包含6萬億token(英語45%/日語30%)
商業友好許可
年收入低於10億日元的組織可申請商業用途許可(需註冊)
訓練穩定性增強
新增歸一化層和改進的Mamba2內核,提升大規模訓練穩定性

模型能力

英語文本生成
日語文本生成
代碼生成(有限支持)
開放域問答

使用案例

內容創作
多語言內容生成
自動生成英語/日語營銷文案、博客文章等
企業應用
內部知識處理
文檔摘要、報告生成等組織內部非商業用途
需遵守收入限制條款
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase