Mistral-Small-3.1-24B-Instructオープンソースモデル - 多言語とビジュアル理解をサポート、ローカルでの効率的な展開と推論

ホーム

Mistral Small 3.1 24B Instruct 2503 Q5 K M GGUF

Triangle104によって開発

Mistral Small 3.1をベースとした240億パラメータの命令微調整モデルで、多言語と視覚理解をサポートし、ローカル展開と効率的な推論に適しています。

テキスト生成画像複数言語対応オープンソースライセンス:Apache-2.0 #128k長文理解 #マルチモーダル視覚分析 #低遅延関数呼び出し

ダウンロード数 57

リリース時間 : 4/6/2025

モデル概要

Mistral Small 3.1は240億パラメータを持つ多言語および視覚理解モデルで、128kトークンのコンテキストウィンドウをサポートし、テキストと視覚タスクに適しています。

モデル特徴

視覚能力

モデルは画像を分析し、視覚内容に基づいて洞察を提供すると同時に、テキスト情報を組み合わせることができます。

多言語サポート

英語、フランス語、ドイツ語、中国語など数十の言語をサポートしています。

エージェント中心

一流のエージェント能力を提供し、ネイティブ関数呼び出しとJSON出力をサポートします。

高度な推論

最先端の対話と推論能力を備えています。

128kトークンコンテキストウィンドウ

長文書の理解と複雑なタスク処理をサポートします。

モデル能力

テキスト生成

視覚理解

多言語処理

関数呼び出し

長文書理解

プログラミングと数学推論

使用事例

対話エージェント

高速応答の対話エージェント

低遅延が求められる対話シナリオに適しています。

ローカル推論

機密データ処理のローカル推論

個人の愛好家や組織がローカルで機密データを処理するのに適しています。

プログラミングと数学

プログラミングと数学推論

プログラミング支援と数学問題解決に適しています。

視覚理解

画像分析

画像を分析し、洞察を提供できます。

🚀 Triangle104/Mistral-Small-3.1-24B-Instruct-2503-Q5_K_M-GGUF

このモデルは、llama.cppを使用してggml.aiのGGUF-my-repoスペース経由で、mistralai/Mistral-Small-3.1-24B-Instruct-2503からGGUF形式に変換されました。モデルの詳細については、元のモデルカードを参照してください。

Mistral Small 3 (2501)をベースに、Mistral Small 3.1 (2503)は最先端のビジョン理解機能を追加し、テキスト性能を損なうことなく、コンテキストの長さを最大128kトークンまで拡張しています。240億のパラメータを持つこのモデルは、テキストとビジョンの両方のタスクでトップクラスの性能を発揮します。このモデルは、Mistral-Small-3.1-24B-Base-2503を命令微調整したバージョンです。

Mistral Small 3.1はローカルでデプロイ可能で、量子化すると、単一のRTX 4090または32GB RAMのMacBookに収まるほど「知識が密集」しています。

以下の用途に最適です:

高速応答の会話エージェント。
低レイテンシの関数呼び出し。
微調整による専門家。
嗜好家や機密データを扱う組織のためのローカル推論。
プログラミングと数学的推論。
長文書理解。
ビジョン理解。

特殊な機能（コンテキストの拡張、特定のモダリティ、ドメイン固有の知識など）を必要とする企業向けに、Mistral AIがコミュニティに提供するもの以上の商用モデルをリリースする予定です。

✨ 主な機能

ビジョン：ビジョン機能により、モデルは画像を分析し、テキストに加えて視覚コンテンツに基づく洞察を提供できます。
多言語対応：英語、フランス語、ドイツ語、ギリシャ語、ヒンディー語、インドネシア語、イタリア語、日本語、韓国語、マレー語、ネパール語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語、スペイン語、スウェーデン語、トルコ語、ウクライナ語、ベトナム語、アラビア語、ベンガル語、中国語、ファルシ語など、数十の言語をサポートします。
エージェント中心：ネイティブの関数呼び出しとJSON出力を備えた最高水準のエージェント機能を提供します。
高度な推論：最先端の会話と推論機能を備えています。
Apache 2.0ライセンス：商用および非商用目的での使用と変更を許可するオープンライセンスです。
コンテキストウィンドウ：128kのコンテキストウィンドウを持ちます。
システムプロンプト：システムプロンプトに対する強力な準拠とサポートを維持します。
トークナイザー：語彙サイズ131kのTekkenトークナイザーを使用しています。

📦 インストール

llama.cppを使用する場合

llama.cppをbrewを通じてインストールします（MacとLinuxで動作します）

brew install llama.cpp

llama.cppサーバーまたはCLIを起動します。

CLI:

llama-cli --hf-repo Triangle104/Mistral-Small-3.1-24B-Instruct-2503-Q5_K_M-GGUF --hf-file mistral-small-3.1-24b-instruct-2503-q5_k_m.gguf -p "The meaning to life and the universe is"

サーバー:

llama-server --hf-repo Triangle104/Mistral-Small-3.1-24B-Instruct-2503-Q5_K_M-GGUF --hf-file mistral-small-3.1-24b-instruct-2503-q5_k_m.gguf -c 2048

注: Llama.cppリポジトリに記載されている使用手順を直接使用することもできます。

ステップ1: llama.cppをGitHubからクローンします。

git clone https://github.com/ggerganov/llama.cpp

ステップ2: llama.cppフォルダに移動し、LLAMA_CURL=1フラグとその他のハードウェア固有のフラグ（例: LinuxのNvidia GPUの場合はLLAMA_CUDA=1）を使用してビルドします。

cd llama.cpp && LLAMA_CURL=1 make

ステップ3: メインバイナリを通じて推論を実行します。

./llama-cli --hf-repo Triangle104/Mistral-Small-3.1-24B-Instruct-2503-Q5_K_M-GGUF --hf-file mistral-small-3.1-24b-instruct-2503-q5_k_m.gguf -p "The meaning to life and the universe is"

または

./llama-server --hf-repo Triangle104/Mistral-Small-3.1-24B-Instruct-2503-Q5_K_M-GGUF --hf-file mistral-small-3.1-24b-instruct-2503-q5_k_m.gguf -c 2048

📄 ライセンス

このモデルはApache 2.0ライセンスの下で提供されています。このオープンライセンスにより、商用および非商用目的での使用と変更が許可されます。

⚠️ 重要提示

個人情報の処理方法について詳しく知りたい場合は、プライバシーポリシーをご覧ください。

属性	详情
モデルタイプ	Triangle104/Mistral-Small-3.1-24B-Instruct-2503-Q5_K_M-GGUF
ベースモデル	mistralai/Mistral-Small-3.1-24B-Instruct-2503
サポート言語	英語、フランス語、ドイツ語、ギリシャ語、ヒンディー語、インドネシア語、イタリア語、日本語、韓国語、マレー語、ネパール語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、セルビア語、スペイン語、スウェーデン語、トルコ語、ウクライナ語、ベトナム語、アラビア語、ベンガル語、中国語、ファルシ語
ライブラリ名	vllm
ライセンス	Apache 2.0
パイプラインタグ	画像 - テキスト - テキスト
タグ	llama-cpp、gguf-my-repo
推論	無効