Qwen3 8B GGUF
Qwen團隊推出的8B參數規模大語言模型,支持超長上下文和多種語言處理
下載量 39.45k
發布時間 : 4/28/2025
模型概述
基於Qwen3架構的8B參數規模大語言模型,擅長創意寫作、角色扮演和多輪對話,具備高級智能體能力和多語言支持
模型特點
超長上下文支持
支持最長131,072 tokens的上下文處理(默認32k),採用YaRN技術
雙模式推理
兼具思維鏈推理與直出模式,可通過/no_think指令切換
多領域增強
數學、編程與常識推理能力經過特別優化
多語言支持
支持超過100種語言與方言處理
模型能力
文本生成
創意寫作
角色扮演
多輪對話
指令跟隨
數學推理
編程輔助
常識推理
使用案例
內容創作
創意寫作
生成小說、詩歌等創意文本
可產生富有想象力的文學內容
角色扮演
模擬不同角色的對話交互
能維持連貫的角色設定和對話
技術應用
編程輔助
代碼生成與解釋
支持多種編程語言的代碼處理
數學推理
解決數學問題和邏輯推理
能處理複雜數學計算和證明
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98