O

Openelm 450M

appleによって開発
OpenELMは、階層的スケーリング戦略を用いてパラメータ割り当てを最適化し、モデル精度を向上させる一連のオープンな効率的言語モデルです。2.7億から30億パラメータの事前学習版と指示チューニング版を提供しています。
ダウンロード数 857
リリース時間 : 4/12/2024

モデル概要

OpenELMシリーズのモデルは、効率的なパラメータ割り当て戦略を通じて言語モデルの性能を向上させることに焦点を当てており、様々な自然言語処理タスクに適しています。

モデル特徴

階層的スケーリング戦略
Transformerモデルの各層で効率的にパラメータを割り当て、モデル性能を最適化
マルチスケール選択
2.7億から30億パラメータまでの異なる規模のモデルを提供し、様々な計算ニーズに対応
完全なオープンソースフレームワーク
データ準備、トレーニング、微調整、評価までの完全なプロセスコードを含む
透明性のある研究サポート
複数の事前学習チェックポイントとトレーニングログを提供し、オープンな研究を促進

モデル能力

テキスト生成
言語理解
指示追従

使用事例

自然言語処理
テキスト生成
事前学習モデルを使用して一貫性のあるテキストコンテンツを生成
指示追従
指示チューニングモデルを使用して特定のタスクを実行
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase