E

Elastic Llama 3.2 1B Instruct

TheStageAIによって開発
セルフホスティング環境で最速かつ最も柔軟なモデル。スライドコントロールでモデルサイズ、推論遅延、品質のバランスを自由に調整可能
ダウンロード数 65
リリース時間 : 4/14/2025

モデル概要

TheStage AI ANNAによって生成された最適化モデルシリーズ。4つの異なる最適化レベルのバージョン(XL/L/M/S)を提供し、セルフホスティング環境で最高のパフォーマンスと品質のバランスを実現

モデル特徴

エラスティック調整
簡単なスライド操作でモデルサイズ、推論遅延、品質のバランスを自由に調整可能
マルチバージョン最適化
XL/L/M/Sの4つの最適化バージョンを提供し、それぞれ異なる速度と精度のバランスに対応
ハードウェア互換性
複数のハードウェアプラットフォーム(H100/L40s GPUおよびAMD/Intel CPU)をサポートし、事前コンパイル済みでJIT不要
シームレス統合
1行のコードでHuggingFace transformersエコシステムと互換性あり

モデル能力

多言語テキスト生成
命令追従
知識質問応答
コンテンツ作成

使用事例

検索エンジン強化
インテリジェントQAシステム
検索エンジンのバックエンドとして正確な回答を提供
MMLUベンチマークで45.5-46.2点を達成
企業ナレッジ管理
内部ナレッジベースQA
従業員の企業ポリシー/プロセスに関する問い合わせに迅速に対応
PIQA常識テストで73.1-74.3点を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase