O

Openelm 450M Instruct

appleによって開発
OpenELMは階層的スケーリング戦略でパラメータ割り当てを最適化したオープンソースの効率的言語モデル群で、2.7億から30億パラメータの事前学習版及び命令チューニング版を含みます。
ダウンロード数 114.41k
リリース時間 : 4/12/2024

モデル概要

OpenELMシリーズは階層的スケーリング戦略によりTransformerモデルの効率を向上させ、2.7億から30億パラメータまでの多様なサイズバージョンを提供し、様々な自然言語処理タスクに適用可能です。

モデル特徴

階層的スケーリング戦略
Transformerの各層でインテリジェントにパラメータを割り当て、モデル効率を大幅に向上
完全オープンソースフレームワーク
データ準備から評価までのフルツールチェーンを提供し、オープンリサーチを促進
マルチスケール選択
2.7億から30億パラメータまでの多様なサイズモデルを提供し、様々なニーズに対応

モデル能力

テキスト生成
命令追従
ゼロショット学習

使用事例

コンテンツ作成
ストーリー続き作成
与えられた冒頭から一貫性のあるストーリー内容を自動生成
例では'昔々山がありました'の続き作成能力を展示
研究開発
言語モデル研究
効率的なモデルアーキテクチャ研究のベースラインモデルとして利用可能
技術レポートには他モデルとの比較データを含む
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase