Qwen3 1.7B Q8 0 GGUF
Qwen3-1.7B-Q8_0-GGUF是基於Qwen/Qwen3-1.7B轉換的GGUF格式模型,支持文本生成任務,具備多語言支持和高效的推理能力。
下載量 277
發布時間 : 4/29/2025
模型概述
Qwen3是通義千問系列大語言模型的最新版本,提供了一系列密集型和混合專家(MoE)模型。基於廣泛的訓練,Qwen3在推理、指令遵循、代理能力和多語言支持方面取得了突破性進展。
模型特點
多語言支持
支持100多種語言和方言,在多語言指令遵循和翻譯方面具備強大能力。
推理能力增強
在數學、代碼生成和常識邏輯推理方面超越了之前的QwQ和Qwen2.5指令模型。
人類偏好對齊
擅長創意寫作、角色扮演、多輪對話和指令遵循,提供更自然、吸引人和沉浸式的對話體驗。
代理能力
能夠在思維和非思維模式下精確集成外部工具,在基於代理的複雜任務中達到開源模型的領先性能。
模型能力
文本生成
多語言支持
數學推理
代碼生成
常識邏輯推理
創意寫作
角色扮演
多輪對話
指令遵循
翻譯
使用案例
自然語言處理
創意寫作
用於生成創意文本,如故事、詩歌等。
提供更自然、吸引人和沉浸式的對話體驗。
角色扮演
用於模擬不同角色的對話和互動。
提供更自然、吸引人和沉浸式的對話體驗。
教育與研究
數學推理
用於解決數學問題和邏輯推理。
在數學推理方面超越了之前的QwQ和Qwen2.5指令模型。
代碼生成
用於生成和優化代碼。
在代碼生成方面超越了之前的QwQ和Qwen2.5指令模型。
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98