Bielik-11B-v2.6-Instruct-GGUF開源波蘭語大模型

首頁

Bielik 11B V2.6 Instruct GGUF

由speakleash開發

Bielik-11B-v2.6-Instruct 是一個波蘭語的大語言模型，由 SpeakLeash 和 ACK Cyfronet AGH 開發，基於 Bielik-11B-v2 微調而來，適用於指令跟隨任務。

大型語言模型

Transformers

開源協議:Apache-2.0 #波蘭語指令微調 #GGUF量化 #本地推理優化

下載量 206

發布時間 : 6/3/2025

模型概述

該模型是一個因果解碼器架構的大語言模型，專門針對波蘭語優化，支持指令跟隨任務。

模型特點

波蘭語優化

專門針對波蘭語進行優化，適合波蘭語文本生成和理解任務。

指令跟隨

經過微調，能夠更好地理解和執行用戶指令。

多量化格式支持

提供多種量化格式（如 q4_k_m、q5_k_m、q6_k 等），適合不同硬件和性能需求。

模型能力

波蘭語文本生成

指令跟隨

對話系統

使用案例

對話系統

波蘭語聊天助手

用於構建波蘭語聊天助手，支持自然對話。

文本生成

波蘭語內容創作

生成波蘭語文章、故事或其他文本內容。

🚀 Bielik-11B-v2.6-Instruct-GGUF

本倉庫包含適用於 SpeakLeash 的 Bielik-11B-v.2.6-Instruct 模型的 GGUF 格式文件。

⚠️ 重要提示

請注意，量化模型可能會降低響應質量併產生幻覺！

🚀 快速開始

可用的量化格式

q4_k_m：對一半的 attention.wv 和 feed_forward.w2 張量使用 Q6_K，其餘使用 Q4_K。
q5_k_m：對一半的 attention.wv 和 feed_forward.w2 張量使用 Q6_K，其餘使用 Q5_K。
q6_k：對所有張量使用 Q8_K。
q8_0：與 float16 幾乎無差別。資源佔用高且速度慢，不建議大多數用戶使用。
16bit：將 fp16 轉換為 GGUF 格式。

Ollama Modfile

GGUF 文件可與 Ollama 一起使用。為此，你需要使用 Modfile 中定義的配置導入模型。以 Bielik-11B-v2.6-Instruct.Q4_K_M.gguf 模型（模型的完整路徑）為例，Modfile 如下：

FROM ./Bielik-11B-v2.6-Instruct.Q4_K_M.gguf

TEMPLATE """<s>{{ if .System }}<|start_header_id|>system<|end_header_id|>

{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>

{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>

{{ .Response }}<|eot_id|>"""

PARAMETER stop "<|start_header_id|>"
PARAMETER stop "<|end_header_id|>"
PARAMETER stop "<|eot_id|>"

# 請記住為實驗性模型（1 - 3 位）設置較低的溫度
PARAMETER temperature 0.1

📚 詳細文檔

模型描述

屬性	詳情
開發者	SpeakLeash 與 ACK Cyfronet AGH
語言	波蘭語
模型類型	因果解碼器
量化來源	Bielik-11B-v2.6-Instruct
微調來源	Bielik-11B-v2
許可證	Apache 2.0 和使用條款

關於 GGUF

GGUF 是 llama.cpp 團隊於 2023 年 8 月 21 日推出的一種新格式。

以下是已知支持 GGUF 的客戶端和庫的不完全列表：

llama.cpp：GGUF 的源項目，提供 CLI 和服務器選項。
text-generation-webui：最廣泛使用的 Web UI，具有許多功能和強大的擴展，支持 GPU 加速。
KoboldCpp：功能齊全的 Web UI，支持所有平臺和 GPU 架構的 GPU 加速，尤其適合講故事。
GPT4All：免費開源的本地運行 GUI，支持 Windows、Linux 和 macOS，具備完整的 GPU 加速。
LM Studio：適用於 Windows、macOS（Silicon）和 Linux 的易於使用且功能強大的本地 GUI，支持 GPU 加速。
LoLLMS Web UI：一個很棒的 Web UI，具有許多有趣和獨特的功能，包括一個完整的模型庫，便於模型選擇。
Faraday.dev：適用於 Windows 和 macOS（Silicon 和 Intel）的有吸引力且易於使用的基於角色的聊天 GUI，支持 GPU 加速。
llama-cpp-python：支持 GPU 加速的 Python 庫，支持 LangChain 和 OpenAI 兼容的 API 服務器。
candle：一個專注於性能的 Rust ML 框架，包括 GPU 支持和易用性。
ctransformers：支持 GPU 加速的 Python 庫，支持 LangChain 和 OpenAI 兼容的 AI 服務器。請注意，ctransformers 很久沒有更新，不支持許多最新的模型。