Qwen3 8B GGUF
Qwen團隊推出的8B參數規模大語言模型,支持超長上下文和多種語言處理
Downloads 39.45k
Release Time : 4/28/2025
Model Overview
基於Qwen3架構的8B參數規模大語言模型,擅長創意寫作、角色扮演和多輪對話,具備高級智能體能力和多語言支持
Model Features
超長上下文支持
支持最長131,072 tokens的上下文處理(默認32k),採用YaRN技術
雙模式推理
兼具思維鏈推理與直出模式,可通過/no_think指令切換
多領域增強
數學、編程與常識推理能力經過特別優化
多語言支持
支持超過100種語言與方言處理
Model Capabilities
文本生成
創意寫作
角色扮演
多輪對話
指令跟隨
數學推理
編程輔助
常識推理
Use Cases
內容創作
創意寫作
生成小說、詩歌等創意文本
可產生富有想象力的文學內容
角色扮演
模擬不同角色的對話交互
能維持連貫的角色設定和對話
技術應用
編程輔助
代碼生成與解釋
支持多種編程語言的代碼處理
數學推理
解決數學問題和邏輯推理
能處理複雜數學計算和證明
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 Chinese
R
uer
2,694
98