ホーム

Mistral 7B OpenOrca GGUF

TheBlokeによって開発

Mistral 7B OpenOrcaはMistral-7Bアーキテクチャに基づく大規模言語モデルで、OpenOrcaチームによって訓練され、テキスト生成タスクに特化しています。

大規模言語モデル英語オープンソースライセンス:Apache-2.0 #効率的な対話生成 #マルチターン対話最適化 #軽量7Bモデル

ダウンロード数 7,792

リリース時間 : 4/25/2025

モデル概要

このモデルはMistral-7Bアーキテクチャに基づく大規模言語モデルで、OpenOrcaデータセットで訓練されており、様々なテキスト生成タスクに適しています。

モデル特徴

効率的なテキスト生成

Mistral-7Bアーキテクチャに基づき、効率的なテキスト生成能力を提供します。

マルチタスクサポート

対話、質問応答など、様々なテキスト生成タスクに適用可能です。

量子化サポート

様々な量子化バージョンのモデルを提供し、異なるハードウェアへの展開を容易にします。

モデル能力

テキスト生成

対話システム

質問応答システム

使用事例

対話システム

インテリジェントカスタマーサポート

インテリジェントカスタマーサポートシステムの構築に使用され、ユーザーの質問に答えます。

コンテンツ生成

記事生成

高品質な記事コンテンツを生成します。

base_model: Open-Orca/Mistral-7B-OpenOrca datasets:

Open-Orca/OpenOrca inference: false language:
en library_name: transformers license: apache-2.0 model_creator: OpenOrca model_name: Mistral 7B OpenOrca model_type: mistral pipeline_tag: text-generation prompt_template: '<|im_start|>system

{system_message}<|im_end|>

<|im_start|>user

{prompt}<|im_end|>

<|im_start|>assistant

' quantized_by: TheBloke

チャット＆サポート: TheBlokeのDiscordサーバー

貢献したいですか？ TheBlokeのPatreonページ

TheBlokeのLLM作業は、アンドリーセン・ホロウィッツ（a16z）からの助成金によって寛大に支援されています

Mistral 7B OpenOrca - GGUF

モデル作成者: OpenOrca
オリジナルモデル: Mistral 7B OpenOrca

説明

このリポジトリには、OpenOrcaのMistral 7B OpenOrcaのGGUF形式モデルファイルが含まれています。

GGUFについて

GGUFは、2023年8月21日にllama.cppチームによって導入された新しい形式です。これは、llama.cppによってサポートされなくなったGGMLの代替です。

以下は、GGUFをサポートすることが知られているクライアントとライブラリの不完全なリストです：

llama.cpp。GGUFのソースプロジェクト。CLIとサーバーオプションを提供します。
text-generation-webui、最も広く使用されているWeb UIで、多くの機能と強力な拡張機能を備えています。GPUアクセラレーションをサポートします。
KoboldCpp、すべてのプラットフォームとGPUアーキテクチャでGPUアクセラレーションを備えた完全な機能を備えたWeb UI。特にストーリーテリングに適しています。
LM Studio、WindowsとmacOS（Silicon）向けの使いやすく強力なローカルGUIで、GPUアクセラレーションを備えています。
LoLLMS Web UI、多くの興味深いユニークな機能を備えた素晴らしいWeb UIで、簡単なモデル選択のための完全なモデルライブラリを含みます。
Faraday.dev、WindowsとmacOS（SiliconとIntelの両方）向けの魅力的で使いやすいキャラクターベースのチャットGUIで、GPUアクセラレーションを備えています。
ctransformers、GPUアクセラレーション、LangChainサポート、OpenAI互換のAIサーバを備えたPythonライブラリ。
llama-cpp-python、GPUアクセラレーション、LangChainサポート、OpenAI互換のAPIサーバを備えたPythonライブラリ。
candle、パフォーマンスに焦点を当てたRust MLフレームワークで、GPUサポートと使いやすさを含みます。

利用可能なリポジトリ

プロンプトテンプレート: ChatML

<|im_start|>system
{system_message}<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant

互換性

これらの量子化されたGGUFv2ファイルは、2023年8月27日以降のllama.cppと互換性があります。d0cee0dのコミット時点で。

また、多くのサードパーティのUIやライブラリとも互換性があります - このREADMEの上部にあるリストをご覧ください。

量子化方法の説明

クリックして詳細を表示

利用可能な新しい方法は以下の通りです：

GGML_TYPE_Q2_K - "type-1" 2ビット量子化、16ブロックを含むスーパーブロック、各ブロックは16ウェイト。ブロックスケールと最小値は4ビットで量子化されます。これにより、実質的に1ウェイトあたり2.5625ビット（bpw）が使用されます。
GGML_TYPE_Q3_K - "type-0" 3ビット量子化、16ブロックを含むスーパーブロック、各ブロックは16ウェイト。スケールは6ビットで量子化されます。これにより、実質的に1ウェイトあたり3.4375 bpwが使用されます。
GGML_TYPE_Q4_K - "type-1" 4ビット量子化、8ブロックを含むスーパーブロック、各ブロックは32ウェイト。スケールと最小値は6ビットで量子化されます。これにより、実質的に1ウェイトあたり4.5 bpwが使用されます。
GGML_TYPE_Q5_K - "type-1" 5ビット量子化。GGML_TYPE_Q4_Kと同じスーパーブロック構造で、5.5 bpwが使用されます。
GGML_TYPE_Q6_K - "type-0" 6ビット量子化。16ブロックを含むスーパーブロック、各ブロックは16ウェイト。スケールは8ビットで量子化されます。これにより、実質的に1ウェイトあたり6.5625 bpwが使用されます。

以下の「提供ファイル」表で、どのファイルがどの方法を使用しているか、そしてどのように使用しているかを確認してください。

提供ファイル

名前	量子化方法	ビット	サイズ	最大RAM使用量	使用例
mistral-7b-openorca.Q2_K.gguf	Q2_K	2	3.08 GB	5.58 GB	最小、品質損失が大きい - ほとんどの目的には推奨されません
mistral-7b-openorca.Q3_K_S.gguf	Q3_K_S	3	3.16 GB	5.66 GB	非常に小さい、高品質損失
mistral-7b-openorca.Q3_K_M.gguf	Q3_K_M	3	3.52 GB	6.02 GB	非常に小さい、高品質損失
mistral-7b-openorca.Q3_K_L.gguf	Q3_K_L	3	3.82 GB	6.32 GB	小さい、かなりの品質損失
mistral-7b-openorca.Q4_0.gguf	Q4_0	4	4.11 GB	6.61 GB	レガシー; 小さい、非常に高い品質損失 - Q3_K_Mの使用を推奨
mistral-7b-openorca.Q4_K_S.gguf	Q4_K_S	4	4.14 GB	6.64 GB	小さい、より大きな品質損失
mistral-7b-openorca.Q4_K_M.gguf	Q4_K_M	4	4.37 GB	6.87 GB	中程度、バランスの取れた品質 - 推奨
mistral-7b-openorca.Q5_0.gguf	Q5_0	5	5.00 GB	7.50 GB	レガシー; 中程度、バランスの取れた品質 - Q4_K_Mの使用を推奨
mistral-7b-openorca.Q5_K_S.gguf	Q5_K_S	5	5.00 GB	7.50 GB	大きい、低品質損失 - 推奨
mistral-7b-openorca.Q5_K_M.gguf	Q5_K_M	5	5.13 GB	7.63 GB	大きい、非常に低い品質損失 - 推奨
mistral-7b-openorca.Q6_K.gguf	Q6_K	6	5.94 GB	8.44 GB	非常に大きい、極めて低い品質損失
mistral-7b-openorca.Q8_0.gguf	Q8_0	8	7.70 GB	10.20 GB	非常に大きい、極めて低い品質損失 - 推奨されません