P

Plamo 2 1b

由pfnet開發
PLaMo 2 1B是由Preferred Elements公司開發的10億參數模型,基於英文和日文數據集進行預訓練,採用混合架構結合Mamba和滑動窗口注意力機制。
下載量 1,051
發布時間 : 2/5/2025

模型概述

PLaMo 2 1B是一個基於英文和日文預訓練的10億參數模型,採用類似Samba的混合架構,結合了選擇性狀態空間模型和滑動窗口注意力機制,適用於文本生成任務。

模型特點

混合架構設計
結合Mamba2選擇性狀態空間模型和滑動窗口注意力機制,提升效率和性能。
多語言支持
支持英文和日文文本生成,適用於雙語場景。
優化訓練穩定性
增加歸一化層以提高訓練穩定性,使用Mamba2內核提升計算效率。

模型能力

文本生成
多語言處理

使用案例

文本生成
英文文本續寫
根據給定的英文開頭生成連貫的後續文本。
日文文本生成
根據日文提示生成相關內容的文本。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase