推理增強

# 推理增強

Qwen3 30B A3B Llamafile

Qwen3是Qwen系列最新一代的大語言模型，提供了一系列密集和混合專家（MoE）模型。基於廣泛的訓練，Qwen3在推理、指令遵循、代理能力和多語言支持方面取得了突破性進展。

大型語言模型

Qwen3 1.7B GGUF

Qwen3是通義千問系列大語言模型的最新代際，提供稠密和混合專家(MoE)模型的全面套件。基於大規模訓練，Qwen3在推理、指令遵循、智能體能力和多語言支持方面實現了突破性進展。

大型語言模型

Bytedance Seed.Seed Coder 8B Reasoning GGUF

Seed-Coder-8B-Reasoning 是由 ByteDance-Seed 開發的一個 8B 參數規模的大型語言模型，專注於代碼生成和推理任務。

大型語言模型

Qwen3 0.6B GPTQ Int8

Qwen3-0.6B是通義千問系列最新一代0.6B參數規模的大語言模型，支持思維與非思維模式切換，具備卓越的推理、指令遵循和智能體能力。

大型語言模型

Qwen3 32B 128k NEO Imatrix Max GGUF

這是Qwen3-32B模型的NEO Imatrix量化版本，採用BF16格式最大化輸出張量以提升推理/生成能力，支持128k上下文長度。

大型語言模型

Qwen3 32B 128k HORROR Imatrix Max GGUF

基於Qwen3-32B優化的恐怖主題文本生成模型，採用Imatrix量化技術增強推理能力，支持128k超長上下文

大型語言模型

Qwen3-32B-AWQ是通義千問系列最新一代32.8B參數的大語言模型，採用AWQ 4-bit量化技術，支持思維與非思維模式切換，具備卓越的推理、指令遵循和智能體能力。

大型語言模型

Qwen3 235B A22B INT4MIX

Qwen3-235B-A22B是通義大模型系列的最新一代產品，提供了一系列密集和混合專家（MoE）模型，在推理、指令遵循、智能體能力和多語言支持方面取得了突破性進展。

大型語言模型

Qwen3 30B A3B GGUF

Qwen3是阿里雲開發的最新大語言模型系列，支持思維模式與非思維模式動態切換，在推理、多語言支持和智能體能力方面表現突出。

大型語言模型英語

Qwen3是通義千問系列最新一代大語言模型，提供完整的稠密模型和專家混合(MoE)模型組合。基於大規模訓練，Qwen3在推理、指令遵循、智能體能力和多語言支持方面實現突破性進展。

大型語言模型

Qwen3是通義千問系列大語言模型的最新版本，提供完整的稠密模型與混合專家(MoE)模型組合。基於大規模訓練，Qwen3在推理能力、指令遵循、智能體功能和多語言支持方面實現突破性進展。

大型語言模型

Qwen2.5 14B DeepSeek R1 1M

融合推理模型和長上下文模型優勢的多用途大語言模型

大型語言模型

Orca 2是微軟開發的研究用途語言模型，專注於提升小型語言模型的推理能力。

大型語言模型

Reasonbert TAPAS

該模型基於tapas-base架構，針對表格輸入進行了預訓練優化，增強了推理能力，適用於問答類任務。

大型語言模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase