O

Openelm 3B Instruct

appleによって開発
OpenELMは、階層的パラメータ割り当て戦略を用いてモデル精度を向上させるオープンソースの効率的な言語モデルのセットで、2.7億から30億パラメータのプリトレーニングおよび指示チューニングバージョンを含みます。
ダウンロード数 8,716
リリース時間 : 4/12/2024

モデル概要

OpenELMは、Appleが提供するオープンソースの効率的な言語モデルシリーズで、革新的な階層的パラメータ割り当て戦略によりTransformer層内のパラメータ分布を最適化し、モデル効率を大幅に向上させます。このシリーズには、さまざまな規模のプリトレーニングモデルと指示ファインチューニングバージョンが含まれており、様々な自然言語処理タスクに適しています。

モデル特徴

階層的パラメータ割り当て
Transformerの各層でパラメータをインテリジェントに割り当て、従来の均一割り当てに比べてモデル効率を大幅に向上
完全なオープンソースエコシステム
データ準備からトレーニング評価までのフルツールチェーンを提供し、CoreNetトレーニングフレームワークを含む
多様な規模選択
2.7億から30億パラメータまでの多様なモデル規模を提供し、異なる計算ニーズに対応
指示チューニングバージョン
基本のプリトレーニングモデルに加え、指示ファインチューニングされたバージョンをリリースし、対話インタラクション能力を最適化

モデル能力

テキスト生成
言語理解
質問応答システム
指示追従

使用事例

教育研究
学術的質問応答
SciQなどの科学的質問応答データセットに基づく優れたパフォーマンスで、教育シナリオの知識質問応答アプリケーションに適しています
SciQデータセットで92.7%の精度を達成
コンテンツ生成
クリエイティブライティング
モデルのテキスト生成能力を活用してストーリー作成を支援
例では「昔々...」というストーリーの開始を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase