Qwen3 235B A22B FP8 Dynamic
Apache-2.0
Qwen3-235B-A22B模型的FP8量化版本,有效降低GPU內存需求,提高計算吞吐量,適用於多種自然語言處理場景。
大型語言模型
Transformers

Q
RedHatAI
2,198
2
Qwen3 30B A3B FP8 Dynamic
Apache-2.0
Qwen3-30B-A3B-FP8-dynamic是基於Qwen3-30B-A3B模型通過FP8量化優化的版本,顯著降低了內存需求和計算成本,同時保持了原始模型的高準確率。
大型語言模型
Transformers

Q
RedHatAI
187
2
Typhoon2.1 Gemma3 4b
泰語大語言模型(指令調優版),擁有40億參數、128K上下文長度且具備函數調用能力
大型語言模型
T
scb10x
2,083
3
Typhoon2.1 Gemma3 12b
Typhoon2.1-Gemma3-12B 是一個基於Gemma3架構的120億參數泰語大語言模型,支持128K上下文長度和函數調用功能。
大型語言模型
Safetensors
T
scb10x
159.13k
2
GLM Z1 32B 0414
MIT
GLM-4-Z1-32B-0414是具備深度思考能力的320億參數推理模型,在數學、代碼和邏輯類任務上表現優異
大型語言模型
Transformers 支持多種語言

G
THUDM
3,822
146
Xlam 2 3b Fc R Gguf
xLAM-2-3b-fc-r是Salesforce推出的3B參數大型行動模型,專注於將用戶意圖轉化為可執行行動,在多輪對話和工具使用方面表現優異。
大型語言模型
Transformers 英語

X
Salesforce
472
2
Fluxi AI Small Vision
Apache-2.0
Fluxi AI 是一款基於 Qwen2-VL-7B-Instruct 的多模態智能助手,具備文本、圖像和視頻處理能力,特別優化了葡萄牙語支持。
圖像生成文本
Transformers 其他

F
JJhooww
25
2
Llama 3.1 Storm 8B GGUF
Llama-3.1-Storm-8B是基於Llama-3.1-8B-Instruct構建的改進模型,在多項基準測試中表現優異,適用於對話和函數調用任務。
大型語言模型 支持多種語言
L
akjindal53244
654
41
Dolphin 2.9 Llama3 70b 5.0bpw H6 Exl2
Dolphin 2.9是基於Llama-3-70b的未經審查AI助手模型,具備多種指令、對話和編程技能,初步支持代理功能和函數調用。
大型語言模型
Transformers 英語

D
LoneStriker
22
3
Maestrale Chat V0.3 Beta
基於Mistral-7b的意大利語對話模型,經過三階段監督微調和KTO對齊
大型語言模型
Transformers 其他

M
mii-llm
2,614
3
Discolm German 7b V1
Apache-2.0
DiscoLM 德語 7b 是一款基於Mistral的大型語言模型,專注於德語應用,是EM German模型家族的繼任者。該模型在大量德語和英語指令數據集上進行了SFT微調,並通過DPO強化學習進一步優化。
大型語言模型
Transformers 支持多種語言

D
DiscoResearch
262
67
Llama 2 7b Chat Hf Function Calling
fLlama 2為Llama 2模型擴展了函數調用能力,能返回結構化JSON響應,包含函數名稱及參數。本版本採用GPTQ方法訓練,提供快速推理和良好精度。
大型語言模型
Transformers 英語

L
Trelis
53
48
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98