O

Open Llama 3b

openlm-researchによって開発
OpenLLaMAはMeta AIのLLaMA大規模言語モデルのオープンソース再現版で、3B、7B、13Bパラメータ規模の事前学習モデルを提供
ダウンロード数 26.20k
リリース時間 : 6/7/2023

モデル概要

RedPajamaデータセットでトレーニングされたオープンウェイト言語モデル、LLaMAアーキテクチャとトレーニング方法を完全に再現、テキスト生成と言語理解タスクに適応

モデル特徴

オープンソース再現
Meta AIのLLaMAモデルアーキテクチャとトレーニング方法を完全再現、ただしオープンデータセットと寛容なライセンスを使用
マルチスケール選択
3B、7B、13Bの3つのパラメータ規模のモデルバージョンを提供、異なる計算ニーズに対応
高性能トレーニング
TPU-v4クラスタを使用してトレーニング、トレーニングスループットをチップあたり2200+トークン/秒に最適化
完全なトレーニングプロセス
ゼロからトレーニングするトークナイザーとモデルウェイトを含む、元のLLaMAリソースに依存不要

モデル能力

テキスト生成
質問応答システム
言語理解
少数ショット学習

使用事例

教育研究
学術的質問応答
科学、歴史などの分野の知識的な質問に回答
複数の評価で元のLLaMAと同等のパフォーマンス
コンテンツ作成
テキスト継続
与えられたプロンプトに基づいて一貫性のあるテキストコンテンツを生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase