O

Openelm 270M

appleによって開発
OpenELMは一連のオープンソースの高効率言語モデルで、階層的スケーリング戦略を用いてTransformerモデルの各層に効率的にパラメータを割り当て、精度を向上させます。
ダウンロード数 4,719
リリース時間 : 4/12/2024

モデル概要

OpenELMシリーズモデルには、270M、450M、1.1B、3Bのパラメータを持つ事前学習および命令調整済みモデルが含まれ、完全なトレーニングフレームワークと評価プロセスを提供します。

モデル特徴

階層的スケーリング戦略
Transformerモデルの各層に効率的にパラメータを割り当て、モデルの精度を向上させます。
完全なオープンソースフレームワーク
データ準備、トレーニング、微調整から評価までの完全なプロセスを提供し、オープンな研究を促進します。
複数の規模選択肢
270M、450M、1.1B、3Bの4種類のパラメータ規模のモデルを選択できます。

モデル能力

テキスト生成
命令追従
ゼロショット学習

使用事例

自然言語処理
質問応答システム
知識ベースの質問応答システムの構築に使用できます。
SciQデータセットで84.70%の精度を達成しました
テキスト補完
プロンプトに基づいて首尾一貫したテキスト内容を生成します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase