O

Openelm 3B

appleによって開発
OpenELMはオープンソースの効率的な言語モデルのセットで、階層的スケーリング戦略を用いてパラメータ割り当てを最適化し、モデルの精度を向上させます。270M、450M、1.1B、3Bの4つのパラメータ規模を含み、事前学習版と指示チューニング版を提供します。
ダウンロード数 1,436
リリース時間 : 4/12/2024

モデル概要

オープンソースの効率的な言語モデルシリーズで、階層化パラメータ割り当て戦略により優れた性能を実現し、様々な自然言語処理タスクに適しています。

モデル特徴

階層化パラメータ割り当て
Transformerの各層でパラメータをインテリジェントに割り当て、従来の均一割り当てに比べてモデル効率を大幅に向上
フルプロセスオープンソース
データ準備からモデルトレーニング、ファインチューニング、評価までの完全なフレームワークを公開
マルチスケール選択
2.7億から30億パラメータまでの様々な規模のモデルを提供し、多様なアプリケーションシナリオに対応

モデル能力

テキスト生成
ゼロショット学習
指示追従
言語理解

使用事例

教育
科学Q&A
SciQなどのデータセットに基づく高精度な科学問題解答
3BモデルはSciQテストセットで92.7%の精度を達成
コンテンツ作成
ストーリー生成
プロンプトに基づいて一貫性のある物語テキストを生成
'昔々'のような中国語プロンプトでのストーリー開始生成をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase