Bielik-11B-v2.6-Instruct-GGUFオープンソースのポーランド語大規模言語モデル

ホーム

Bielik 11B V2.6 Instruct GGUF

speakleashによって開発

Bielik-11B-v2.6-Instructはポーランド語の大規模言語モデルで、SpeakLeashとACK Cyfronet AGHによって開発され、Bielik-11B-v2をベースに微調整され、命令追従タスクに適しています。

大規模言語モデル

Transformers

オープンソースライセンス:Apache-2.0 #ポーランド語の命令微調整 #GGUF量子化 #ローカル推論の最適化

ダウンロード数 206

リリース時間 : 6/3/2025

モデル概要

このモデルは因果デコーダアーキテクチャの大規模言語モデルで、ポーランド語に特化して最適化され、命令追従タスクをサポートしています。

モデル特徴

ポーランド語最適化

ポーランド語に特化して最適化され、ポーランド語のテキスト生成と理解タスクに適しています。

命令追従

微調整され、ユーザーの命令をよりよく理解して実行できます。

多量子化形式サポート

複数の量子化形式（q4_k_m、q5_k_m、q6_kなど）を提供し、さまざまなハードウェアとパフォーマンス要件に対応します。

モデル能力

ポーランド語テキスト生成

命令追従

対話システム

使用事例

対話システム

ポーランド語チャットアシスタント

ポーランド語チャットアシスタントを構築するために使用され、自然な対話をサポートします。

テキスト生成

ポーランド語コンテンツ作成

ポーランド語の記事、物語またはその他のテキストコンテンツを生成します。

🚀 Bielik-11B-v2.6-Instruct-GGUF

このリポジトリには、SpeakLeash の Bielik-11B-v.2.6-Instruct のGGUF形式のモデルファイルが含まれています。

⚠️ 重要提示

量子化されたモデルは応答品質が低下し、幻覚が生じる可能性があることに注意してください！

✨ 主な機能

利用可能な量子化形式

q4_k_m: 注意機構の attention.wv とフィードフォワード層の feed_forward.w2 テンソルの半分に Q6_K を使用し、それ以外には Q4_K を使用します。
q5_k_m: 注意機構の attention.wv とフィードフォワード層の feed_forward.w2 テンソルの半分に Q6_K を使用し、それ以外には Q5_K を使用します。
q6_k: すべてのテンソルに Q8_K を使用します。
q8_0: 浮動小数点数16ビットとほとんど区別がつきません。リソース使用量が多く、処理速度が遅いです。ほとんどのユーザーにはおすすめしません。
16bit: fp16 を GGUF 形式に変換したものです。

Ollama Modfile

GGUFファイルは Ollama で使用できます。これを行うには、Modfile で定義された設定を使用してモデルをインポートする必要があります。例えば、モデル Bielik-11B-v2.6-Instruct.Q4_K_M.gguf（モデルの完全なパス）の Modfile は次のようになります。

FROM ./Bielik-11B-v2.6-Instruct.Q4_K_M.gguf

TEMPLATE """<s>{{ if .System }}<|start_header_id|>system<|end_header_id|>

{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>

{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>

{{ .Response }}<|eot_id|>"""

PARAMETER stop "<|start_header_id|>"
PARAMETER stop "<|end_header_id|>"
PARAMETER stop "<|eot_id|>"

# Remeber to set low temperature for experimental models (1-3bits)
PARAMETER temperature 0.1

📚 ドキュメント

モデルの説明

属性	详情
開発者	SpeakLeash と ACK Cyfronet AGH
言語	ポーランド語
モデルタイプ	因果的デコーダー専用
量子化元のモデル	Bielik-11B-v2.6-Instruct
ファインチューニング元のモデル	Bielik-11B-v2
ライセンス	Apache 2.0 および利用規約

GGUFについて

GGUFは、llama.cppチームによって2023年8月21日に導入された新しい形式です。

GGUFをサポートすることが知られているクライアントとライブラリの不完全なリストを以下に示します。

llama.cpp。GGUFのソースプロジェクトです。CLIとサーバーオプションを提供します。
text-generation-webui、最も広く使用されているウェブUIで、多くの機能と強力な拡張機能を備えています。GPUアクセラレーションをサポートしています。
KoboldCpp、すべてのプラットフォームとGPUアーキテクチャでGPUアクセラレーションを備えた、機能豊富なウェブUIです。特にストーリーテリングに適しています。
GPT4All、Windows、Linux、macOSをサポートし、完全なGPUアクセラレーションを備えた無料でオープンソースのローカル実行GUIです。
LM Studio、Windows、macOS（Silicon）、Linux用の使いやすく強力なローカルGUIで、GPUアクセラレーションを備えています。
LoLLMS Web UI、多くの興味深い独自の機能を備えた素晴らしいウェブUIで、簡単なモデル選択のための完全なモデルライブラリを含んでいます。
Faraday.dev、WindowsとmacOS（SiliconとIntelの両方）用の魅力的で使いやすいキャラクターベースのチャットGUIで、GPUアクセラレーションを備えています。
llama-cpp-python、GPUアクセラレーション、LangChainサポート、およびOpenAI互換のAPIサーバーを備えたPythonライブラリです。
candle、パフォーマンスに重点を置いたRustの機械学習フレームワークで、GPUサポートと使いやすさを備えています。
ctransformers、GPUアクセラレーション、LangChainサポート、およびOpenAI互換のAIサーバーを備えたPythonライブラリです。ただし、ctransformersは長い間更新されておらず、多くの最近のモデルをサポートしていません。