思維鏈推理

# 思維鏈推理

Mmada 8B MixCoT

MMaDA是一類新型的多模態擴散基礎模型，在文本推理、多模態理解和文本到圖像生成等多個領域表現卓越。

文本生成圖像

Deepseek R1 Llama 8B F32 GGUF

DeepSeek-R1-Llama-8B-F32-GGUF 是 DeepSeek-R1-Distill-Llama-8B 的量化版本，採用強化學習直接訓練，具備自我驗證、反思和生成擴展思維鏈等能力。

大型語言模型

Transformers 英語

Stockmark 2 VL 100B Beta

Stockmark-2-VL-100B-beta 是一款具有1000億參數的日語專用視覺語言模型，具備思維鏈（CoT）推理能力，可用於文檔閱讀理解。

圖像生成文本

Transformers 支持多種語言

Sarvamai Sarvam M GGUF

這是Sarvam-m模型的量化版本，支持多種印度語言和英語的文本生成任務。

大型語言模型支持多種語言

Qwenstoryteller I1 GGUF

QwenStoryteller是一個基於視覺語言模型的講故事模型，專注於視覺敘事和跨幀一致性。

圖像生成文本英語

Qwenstoryteller GGUF

基於Qwen的視覺敘事模型量化版本，專注於跨幀一致的故事生成和圖像轉文本任務

圖像生成文本英語

N1 是由 GoofyLM 開發的一個小型實驗性思維鏈（COT）模型，基於 LLaMA 架構構建，專注於逐步推理問題。

大型語言模型

Transformers 英語

Qwen3 235B A22B AWQ

Qwen3-235B-A22B是Qwen系列最新一代的大語言模型，採用混合專家(MoE)架構，具有2350億參數和220億激活參數，在推理、指令遵循、代理能力和多語言支持方面表現卓越。

大型語言模型

cognitivecomputations

MAI-DS-R1 是 DeepSeek-R1 推理模型，經過微軟 AI 團隊的後續訓練，以提升其在受限話題上的響應能力並優化其風險表現，同時保持其推理能力和競爭性能。

大型語言模型

Videochat R1 7B Caption

VideoChat-R1_7B_caption 是一個基於 Qwen2-VL-7B-Instruct 的多模態視頻文本生成模型，專注於視頻內容理解和描述生成。

視頻生成文本

Transformers 英語

Hicoder R1 Distill Gemma 27B

基於谷歌Gemma-3 27B微調的大型語言模型，專注思維鏈推理和代碼生成任務，優化了GPU顯存和系統內存管理。

大型語言模型

UIGEN-T1.5是基於Qwen2.5-Coder-32B-Instruct微調的先進Transformer UI生成模型，專門用於生成現代且獨特的前端用戶界面。

大型語言模型

Transformers 英語

基於Qwen2.5-Coder-7B-Instruct微調的高級UI生成模型，擅長生成現代且視覺吸引人的HTML/CSS代碼。

大型語言模型

Transformers 英語

基於Qwen2.5-Coder-14B-Instruct微調的高級Transformer界面生成模型，擅長生成現代且獨特的前端用戶界面

大型語言模型

Transformers 英語

Deepseek R1 14b Cot Math Reasoning Full GGUF

14B參數規模的數學推理大語言模型，支持思維鏈推理

大型語言模型

Deephermes 3 Llama 3 3B Preview Abliterated

DeepHermes 3預覽版Abliterated是Nous Research旗艦級Hermes系列大語言模型的最新版本，整合了推理與常規LLM響應模式。

大型語言模型

Transformers 英語

Gemma 3 4b Reasoning

Gemma-3-4b推理是基於Transformer架構的語言模型，採用GRPO方法微調，專注於推理任務優化。

大型語言模型

Transformers 英語

TraceBack 12b 是基於 Mistral-Nemo-Instruct 架構的 4bit 量化版本，專注於指令遵循和思維鏈推理任務。

大型語言模型

Tifa DeepsexV2 7b MGRPO Safetensors GGUF

Tifa-DeepsexV2-7b-MGRPO-safetensors 是一個基於 transformers 庫的多語言（中文和英語）大語言模型，經過增量預訓練、監督微調和強化學習優化，適用於角色扮演和思維鏈任務。

大型語言模型支持多種語言

Vikhr YandexGPT 5 Lite 8B It

基於YandexGPT-5-Lite-8B-pretrain的指令模型，通過俄語數據集GrandMaster-PRO-MAX和Grounded-RAG-RU-v2進行SFT訓練，擅長俄語和英語任務。

大型語言模型

Transformers 支持多種語言

Acemath 72B Instruct

AceMath 是一系列專為數學推理設計的前沿模型，基於 Qwen 改進，擅長使用思維鏈（CoT）推理解決英文數學問題。

大型語言模型

Safetensors 英語

Llama3.1 Korean V0.1 Sft By Aidx

基於Llama3.1 instruct基礎模型開發，專為韓語及韓國多元文化場景優化的文本生成模型

大型語言模型

Safetensors 支持多種語言

MD Judge V0 2 Internlm2 7b

基於internlm2-7b-chat微調的安全防護工具，提供人類可讀的判定解釋和細粒度危害評分

大型語言模型

Transformers 英語

Flan T5 Tsa Thor Xl

基於Flan-T5-XL微調的目標情感分析模型，採用三跳推理思維鏈(THoR)框架訓練，專為英文文本設計

大型語言模型

Transformers 英語

Llama 3 Cat 8b Instruct V1

基於llama 3 8b的微調模型，專注於系統提示的忠實度、幫助性和角色沉浸感

大型語言模型

Spyazweb AI DeepMind Project

基於Mixtral架構的多功能大語言模型，融合深度心智與自我優化能力，支持多語言文本生成與複雜推理任務

大型語言模型

Transformers 英語

基於Meta的Llama-3構建的8B參數模型，使用貝果數據集微調，採用單一的llama-3指令格式。

大型語言模型

Quietstar 8 Ahead

基於Mistral-7b模型，採用Quiet-STaR方法進行持續預訓練，在生成每個輸出詞元前會先生成8個思維詞元，提升推理能力。

大型語言模型

Nli Entailment Verifier Xxl

基於flan-t5-xxl微調的NLI模型，用於驗證前提是否支持假設，特別優化多句前提場景

大型語言模型

Transformers 英語

Synthia 70B V1.5

Synthia-70B-v1.5是一個700億參數的大型語言模型，基於Llama2架構構建，專注於通過思維樹方法進行復雜推理和連貫回答。

大型語言模型

Llemma 34B是一個專注於數學領域的語言模型，基於Code Llama 34B的權重進行初始化，並在Proof-Pile-2數據集上訓練了500億個token。

大型語言模型

Transformers 英語

Synthia 70B V1.2b

SynthIA（合成智能代理）是基於Orca風格數據集訓練的LLama-2-70B模型，擅長遵循指令及進行長對話。

大型語言模型

Transformers 英語

Minotaur 13b Fixed

Minotaur 13B是基於LlaMA-13B進行指令微調的模型，使用完全開源數據集進行微調，確保可復現性。

大型語言模型

openaccess-ai-collective

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase