Qwen3-1.7B-Q8_0-GGUF開源模型 - 免費部署，多語言文本高效生成

首頁

Qwen3 1.7B Q8 0 GGUF

由Triangle104開發

Qwen3-1.7B-Q8_0-GGUF是基於Qwen/Qwen3-1.7B轉換的GGUF格式模型，支持文本生成任務，具備多語言支持和高效的推理能力。

大型語言模型開源協議:Apache-2.0 #思維模式切換 #多語言對話 #長文本推理

下載量 277

發布時間 : 4/29/2025

模型概述

Qwen3是通義千問系列大語言模型的最新版本，提供了一系列密集型和混合專家(MoE)模型。基於廣泛的訓練，Qwen3在推理、指令遵循、代理能力和多語言支持方面取得了突破性進展。

模型特點

多語言支持

支持100多種語言和方言，在多語言指令遵循和翻譯方面具備強大能力。

推理能力增強

在數學、代碼生成和常識邏輯推理方面超越了之前的QwQ和Qwen2.5指令模型。

人類偏好對齊

擅長創意寫作、角色扮演、多輪對話和指令遵循，提供更自然、吸引人和沉浸式的對話體驗。

代理能力

能夠在思維和非思維模式下精確集成外部工具，在基於代理的複雜任務中達到開源模型的領先性能。

模型能力

文本生成

多語言支持

數學推理

代碼生成

常識邏輯推理

創意寫作

角色扮演

多輪對話

指令遵循

翻譯

使用案例

自然語言處理

創意寫作

用於生成創意文本，如故事、詩歌等。

提供更自然、吸引人和沉浸式的對話體驗。

角色扮演

用於模擬不同角色的對話和互動。

提供更自然、吸引人和沉浸式的對話體驗。

教育與研究

數學推理

用於解決數學問題和邏輯推理。

在數學推理方面超越了之前的QwQ和Qwen2.5指令模型。

代碼生成

用於生成和優化代碼。

在代碼生成方面超越了之前的QwQ和Qwen2.5指令模型。

🚀 Triangle104/Qwen3-1.7B-Q8_0-GGUF

本項目將模型從 Qwen/Qwen3-1.7B 轉換為 GGUF 格式，轉換借助 llama.cpp 並通過 ggml.ai 的 GGUF-my-repo 空間完成。如需瞭解該模型的更多詳細信息，請參考原始模型卡片。

✨ 主要特性

Qwen3 是通義大模型系列的最新一代產品，提供了一系列密集型和專家混合（MoE）模型。經過大量訓練，Qwen3 在推理、指令遵循、智能體能力和多語言支持等方面取得了突破性進展，具備以下關鍵特性：

雙模式無縫切換：在單個模型中獨特地支持思維模式（用於複雜邏輯推理、數學和編碼）和非思維模式（用於高效的通用對話）之間的無縫切換，確保在各種場景下都能實現最佳性能。
強大的推理能力：推理能力顯著增強，在數學、代碼生成和常識邏輯推理方面超越了之前的 QwQ（思維模式下）和 Qwen2.5 指令模型（非思維模式下）。
高度的人類偏好對齊：在創意寫作、角色扮演、多輪對話和指令遵循方面表現出色，能夠提供更自然、引人入勝和沉浸式的對話體驗。
卓越的智能體能力：擅長智能體能力，能夠在思維和非思維模式下與外部工具進行精確集成，在複雜的基於智能體的任務中在開源模型中取得領先性能。
廣泛的語言支持：支持 100 多種語言和方言，具備強大的多語言指令遵循和翻譯能力。

📦 安裝指南

使用 Homebrew 安裝 llama.cpp（適用於 Mac 和 Linux）

brew install llama.cpp

💻 使用示例

命令行界面（CLI）

llama-cli --hf-repo Triangle104/Qwen3-1.7B-Q8_0-GGUF --hf-file qwen3-1.7b-q8_0.gguf -p "The meaning to life and the universe is"

服務器模式

llama-server --hf-repo Triangle104/Qwen3-1.7B-Q8_0-GGUF --hf-file qwen3-1.7b-q8_0.gguf -c 2048

直接使用檢查點

你也可以通過 Llama.cpp 倉庫中列出的使用步驟直接使用此檢查點：

從 GitHub 克隆 llama.cpp：

git clone https://github.com/ggerganov/llama.cpp

進入 llama.cpp 文件夾，並使用 LLAMA_CURL=1 標誌以及其他特定於硬件的標誌（例如，在 Linux 上使用英偉達 GPU 時使用 LLAMA_CUDA=1）進行編譯：

cd llama.cpp && LLAMA_CURL=1 make

通過主二進制文件運行推理：

./llama-cli --hf-repo Triangle104/Qwen3-1.7B-Q8_0-GGUF --hf-file qwen3-1.7b-q8_0.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo Triangle104/Qwen3-1.7B-Q8_0-GGUF --hf-file qwen3-1.7b-q8_0.gguf -c 2048

📚 詳細文檔

模型概述

Qwen3-1.7B 具有以下特點：

屬性	詳情
模型類型	因果語言模型
訓練階段	預訓練和後訓練
參數數量	17 億
非嵌入參數數量	14 億
層數	28
注意力頭數量（GQA）	Q 為 16，KV 為 8
上下文長度	32768