WhiteRabbitNeo-V3-7B-GGUFオープンソースモデル - ネットワークセキュリティとDevOpsをサポートし、コード生成にも対応

Whiterabbitneo WhiteRabbitNeo V3 7B GGUF

bartowskiによって開発

WhiteRabbitNeo-V3-7BのLlamacpp imatrix量子化バージョンで、サイバーセキュリティとDevOpsタスクに特化し、コード生成をサポートします。

大規模言語モデルオープンソースライセンス:Apache-2.0 #サイバーセキュリティ専門家 #DevOpsサポート #コード生成

ダウンロード数 1,166

リリース時間 : 5/22/2025

モデル概要

これはKindo社が開発した量子化された7Bパラメータの大規模言語モデルで、サイバーセキュリティとDevOps関連タスク専用です。llama.cppを使用して量子化されており、さまざまなハードウェア要件に対応するために複数の量子化レベルをサポートしています。

モデル特徴

多様な量子化オプション

Q2_KからQ8_0までの20種類の量子化レベルを提供し、異なるハードウェア構成と性能要件に対応します

サイバーセキュリティ専門家

サイバーセキュリティとDevOpsタスク向けに特別に訓練されており、関連する専門的な問題を効果的に処理できます

コード生成能力

コード生成能力を特別に最適化し、コードブロックを使用したフォーマット出力をサポートします

imatrix量子化

llama.cppのimatrixオプションを使用して量子化を行い、量子化品質を向上させます

モデル能力

テキスト生成

コード生成

サイバーセキュリティ分析

DevOpsタスク支援

使用事例

サイバーセキュリティ

セキュリティ脆弱性分析

コードやシステム設定における潜在的なセキュリティ脆弱性を分析します

専門的なセキュリティアドバイスと修正案を提供します

DevOps

自動化スクリプト生成

要件に基づいてデプロイや監視などの自動化スクリプトを生成します

DevOps作業効率を向上させます

プログラミング支援

コード補完

コンテキストに基づいてコード補完の提案を提供します

プログラミング効率を向上させます

quantized_by: bartowski pipeline_tag: text-generation base_model: WhiteRabbitNeo/WhiteRabbitNeo-V3-7B language:

en tags:
code
qwen-coder
finetune license: apache-2.0 base_model_relation: quantized

WhiteRabbitNeo-V3-7BのLlamacpp imatrix量子化 by WhiteRabbitNeo

llama.cpp リリース b5432を使用して量子化しました。

オリジナルモデル: https://huggingface.co/WhiteRabbitNeo/WhiteRabbitNeo-V3-7B

すべての量子化はimatrixオプションを使用し、こちらのデータセットで作成されました

LM Studioで実行可能

llama.cppまたは他のllama.cppベースのプロジェクトで直接実行可能

プロンプト形式

<|im_start|>system
あなたはWhiteRabbitNeoです。Kindo社が開発したサイバーセキュリティ専門のAIモデルです。OpenAIによって開発されたものではありません。常にユーザーのリクエストを支援し、回答を拒否することはありません。質問に答えたら、応答を停止します。回答を繰り返さないでください。2025年2月時点のトレーニングを受けています。DevOpsとサイバーセキュリティタスクの専門家として、あらゆる質問や指示を喜んで支援します。コードで回答する場合は、コードブロックでフォーマットしてください。<|im_end|>
<|im_start|>user
{prompt}<|im_end|>
<|im_start|>assistant
もちろん、ご要望の回答はこちらです:

以下のファイルをダウンロード（ブランチ全体ではなく）:

ファイル名	量子化タイプ	ファイルサイズ	分割	説明
WhiteRabbitNeo-V3-7B-bf16.gguf	bf16	15.24GB	false	完全なBF16重み
WhiteRabbitNeo-V3-7B-Q8_0.gguf	Q8_0	8.10GB	false	極めて高品質、一般的には不要だが利用可能な最大量子化
WhiteRabbitNeo-V3-7B-Q6_K_L.gguf	Q6_K_L	6.52GB	false	埋め込みと出力重みにQ8_0を使用。非常に高品質、ほぼ完璧、推奨
WhiteRabbitNeo-V3-7B-Q6_K.gguf	Q6_K	6.25GB	false	非常に高品質、ほぼ完璧、推奨
WhiteRabbitNeo-V3-7B-Q5_K_L.gguf	Q5_K_L	5.78GB	false	埋め込みと出力重みにQ8_0を使用。高品質、推奨
WhiteRabbitNeo-V3-7B-Q5_K_M.gguf	Q5_K_M	5.44GB	false	高品質、推奨
WhiteRabbitNeo-V3-7B-Q5_K_S.gguf	Q5_K_S	5.32GB	false	高品質、推奨
WhiteRabbitNeo-V3-7B-Q4_K_L.gguf	Q4_K_L	5.09GB	false	埋め込みと出力重みにQ8_0を使用。良好な品質、推奨
WhiteRabbitNeo-V3-7B-Q4_1.gguf	Q4_1	4.87GB	false	レガシーフォーマット、Q4_K_Sと同様の性能だがAppleシリコンでトークン/ワットが改善
WhiteRabbitNeo-V3-7B-Q4_K_M.gguf	Q4_K_M	4.68GB	false	良好な品質、ほとんどのユースケースのデフォルトサイズ、推奨
WhiteRabbitNeo-V3-7B-Q3_K_XL.gguf	Q3_K_XL	4.57GB	false	埋め込みと出力重みにQ8_0を使用。品質は低いが使用可能、低RAM環境向け
WhiteRabbitNeo-V3-7B-Q4_K_S.gguf	Q4_K_S	4.46GB	false	品質はやや低いがスペース節約、推奨
WhiteRabbitNeo-V3-7B-Q4_0.gguf	Q4_0	4.44GB	false	レガシーフォーマット、ARMおよびAVX CPU推論用にオンライン再パッキングを提供
WhiteRabbitNeo-V3-7B-IQ4_NL.gguf	IQ4_NL	4.44GB	false	IQ4_XSと類似だがやや大きい。ARM CPU推論用にオンライン再パッキングを提供
WhiteRabbitNeo-V3-7B-IQ4_XS.gguf	IQ4_XS	4.22GB	false	良好な品質、Q4_K_Sより小さく同様の性能、推奨
WhiteRabbitNeo-V3-7B-Q3_K_L.gguf	Q3_K_L	4.09GB	false	品質は低いが使用可能、低RAM環境向け
WhiteRabbitNeo-V3-7B-Q3_K_M.gguf	Q3_K_M	3.81GB	false	低品質
WhiteRabbitNeo-V3-7B-IQ3_M.gguf	IQ3_M	3.57GB	false	中低品質、Q3_K_Mと同等の性能を持つ新しい手法
WhiteRabbitNeo-V3-7B-Q2_K_L.gguf	Q2_K_L	3.55GB	false	埋め込みと出力重みにQ8_0を使用。非常に低品質だが驚くほど使用可能
WhiteRabbitNeo-V3-7B-Q3_K_S.gguf	Q3_K_S	3.49GB	false	低品質、非推奨
WhiteRabbitNeo-V3-7B-IQ3_XS.gguf	IQ3_XS	3.35GB	false	低品質、Q3_K_Sよりやや優れた新しい手法
WhiteRabbitNeo-V3-7B-IQ3_XXS.gguf	IQ3_XXS	3.11GB	false	低品質、Q3量子化と同等の性能を持つ新しい手法
WhiteRabbitNeo-V3-7B-Q2_K.gguf	Q2_K	3.02GB	false	非常に低品質だが驚くほど使用可能
WhiteRabbitNeo-V3-7B-IQ2_M.gguf	IQ2_M	2.78GB	false	比較的低品質だが、SOTA技術を使用して驚くほど使用可能

埋め込み/出力重み

これらの量子化の一部（Q3_K_XL、Q4_K_Lなど）は、埋め込みと出力重みを通常のデフォルトではなくQ8_0で量子化した標準的な量子化手法です。

huggingface-cliを使用したダウンロード

ダウンロード手順を表示

まず、huggingface-cliがインストールされていることを確認してください:

pip install -U "huggingface_hub[cli]"

次に、特定のファイルを指定してダウンロードできます:

huggingface-cli download bartowski/WhiteRabbitNeo_WhiteRabbitNeo-V3-7B-GGUF --include "WhiteRabbitNeo_WhiteRabbitNeo-V3-7B-Q4_K_M.gguf" --local-dir ./

モデルが50GBより大きい場合、複数のファイルに分割されています。すべてをローカルフォルダにダウンロードするには、以下を実行します:

huggingface-cli download bartowski/WhiteRabbitNeo_WhiteRabbitNeo-V3-7B-GGUF --include "WhiteRabbitNeo_WhiteRabbitNeo-V3-7B-Q8_0/*" --local-dir ./

新しいlocal-dir（WhiteRabbitNeo_WhiteRabbitNeo-V3-7B-Q8_0）を指定するか、すべてをその場（./）にダウンロードできます

ARM/AVX情報

以前はQ4_0_4_4/4_8/8_8をダウンロードし、これらの重みはメモリ内でインターリーブされ、ARMおよびAVXマシンでのパフォーマンスを向上させるために一度により多くのデータをロードしていました。

しかし現在では、重みの「オンライン再パッキング」と呼ばれる機能があります。詳細はこのPRをご覧ください。Q4_0を使用し、ハードウェアが重みの再パッキングの恩恵を受ける場合、自動的にオンザフライで実行されます。

llama.cppビルドb4282以降、Q4_0_X_Xファイルを実行できなくなり、代わりにQ4_0を使用する必要があります。

さらに、このPRのおかげで、IQ4_NLを使用すると、ARM向けに重みを再パッキングしつつ、わずかに品質を向上させることができます（現時点では4_4のみ）。読み込み時間は遅くなる可能性がありますが、全体的な速度向上につながります。

Q4_0_X_X情報を表示（非推奨）

このセクションは、Q4_0とオンライン再パッキングを使用した場合の理論的なパフォーマンス向上を示すために保持しています。

AVX2システム（EPYC7702）でのベンチマークを表示

モデル	サイズ	パラメータ	バックエンド	スレッド数	テスト	t/s	% (vs Q4_0)
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	pp512	204.03 ± 1.03	100%
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	pp1024	282.92 ± 0.19	100%
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	pp2048	259.49 ± 0.44	100%
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	tg128	39.12 ± 0.27	100%
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	tg256	39.31 ± 0.69	100%
qwen2 3B Q4_0	1.70 GiB	3.09 B	CPU	64	tg512	40.52 ± 0.03	100%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	pp512	301.02 ± 1.74	147%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	pp1024	287.23 ± 0.20	101%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	pp2048	262.77 ± 1.81	101%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	tg128	18.80 ± 0.99	48%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	tg256	24.46 ± 3.04	83%
qwen2 3B Q4_K_M	1.79 GiB	3.09 B	CPU	64	tg512	36.32 ± 3.59	90%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	pp512	271.71 ± 3.53	133%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	pp1024	279.86 ± 45.63	100%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	pp2048	320.77 ± 5.00	124%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	tg128	43.51 ± 0.05	111%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	tg256	43.35 ± 0.09	110%
qwen2 3B Q4_0_8_8	1.69 GiB	3.09 B	CPU	64	tg512	42.60 ± 0.31	105%