128k長上下文

# 128k長上下文

Devstral Small 2505 GGUF

專為軟件工程項目打造的高效語言模型，輕量級設計，支持128k大上下文窗口，適用於複雜編碼任務。

大型語言模型支持多種語言

Devstral Small 2505 Unsloth Bnb 4bit

Devstral是由Mistral AI和All Hands AI合作開發的軟件工程任務代理型大語言模型，擅長使用工具探索代碼庫、編輯多個文件以及驅動軟件工程代理。

大型語言模型

Safetensors 支持多種語言

KernelLLM是基於Llama 3.1 Instruct微調的模型，專門用於編寫使用Triton的GPU內核。

大型語言模型

lmstudio-community

Devstral Small 2505 GGUF

Devstral是一款專為軟件工程任務設計的智能LLM，由Mistral AI和All Hands AI合作開發，擅長代碼探索、多文件編輯和驅動軟件工程代理。

大型語言模型支持多種語言

Devstral Small 2505

Devstral是由Mistral AI與All Hands AI合作開發的面向軟件工程任務的智能大語言模型，擅長代碼庫探索、多文件編輯和驅動軟件工程代理。

大型語言模型

Safetensors 支持多種語言

Xgen Small 9B Instruct R

xGen-small是一款企業級緊湊型語言模型，通過領域聚焦的數據整理、可擴展的預訓練、長度擴展和強化學習微調，以可預測的低成本實現長上下文性能表現。

大型語言模型

Transformers 英語

Qwen2.5 VL 72B Instruct GGUF

通義千問推出的多模態大模型，支持圖像文本生成和128k長上下文處理，具備多語言能力。

圖像生成文本英語

lmstudio-community

Zero Mistral 24B

Zero-Mistral-24B是基於Mistral-Small-3.1-24B-Instruct-2503改進的純文本模型，主要適配俄語和英語，移除了原版的視覺功能，專注於文本生成任務。

大型語言模型

Transformers 支持多種語言

Pixtral 12b GGUF

Mistral-Community推出的多模態大模型，支持圖像和文本處理，具備128k上下文長度和可變圖像尺寸處理能力。

圖像生成文本

lmstudio-community

xLAM-2是Salesforce研發的大型動作模型系列，專注於多輪對話和函數調用能力，可作為AI代理的核心組件。

大型語言模型

Transformers 英語

Llama 3.1 405B Instruct

Llama 3.1是由Meta開發的多語言大語言模型系列，包含8B、70B和405B三種規模，支持多語言文本生成和代碼生成任務。

大型語言模型

Transformers 支持多種語言

120億參數大語言模型，專為速度、效率和上下文準確性優化，支持RAG增強技術和128k上下文窗口。

大型語言模型

riple-saanvi-lab

Qwen2.5 The Wisemen QwQ Deep Tiny Sherlock 32B

基於QwQ-32B推理與思維模型，融合了多個頂級推理模型的特色，專注於減少提示中的'過度思考'，適用於創意用例和深入推理。

大型語言模型

Transformers 其他

Llama3.1 MOE 4X8B Gated IQ Multi Tier COGITO Deep Reasoning 32B GGUF

一個具備可調節推理能力的混合專家(MoE)模型，通過4個8B模型的協作實現增強推理和文本生成能力

大型語言模型支持多種語言

Llama SEA LION V3.5 70B R

Llama-SEA-LION-v3.5-70B-R 是一個專為東南亞語言優化的混合功能大語言模型，支持13種語言，具備複雜推理和通用文本生成能力。

大型語言模型

Transformers 支持多種語言

Llama SEA LION V3.5 8B R

Llama-SEA-LION-v3.5-8B-R是一個針對東南亞語言優化的8B參數大型語言模型，支持13種東南亞語言，具備複雜推理和通用文本生成能力。

大型語言模型

Transformers 支持多種語言

Cogito V1 Preview Qwen 32B Exl2 4.65bpw

Cogito v1 預覽版是基於Qwen2.5-32B的指令調優生成式模型，支持30多種語言，上下文長度達128k，針對編程、STEM、指令遵循和通用幫助性進行了優化。

大型語言模型

xLAM-2系列是基於先進數據合成和訓練流程構建的大型動作模型(LAMs)，專注於多輪對話和工具使用，在函數調用和代理任務中表現卓越。

大型語言模型

Transformers 英語

Xlam 2 32b Fc R

xLAM-2是Salesforce推出的新一代大型動作模型，專注於多輪對話和函數調用能力，能夠將用戶意圖轉化為可執行動作，作為AI代理的核心組件。

大型語言模型

Transformers 英語

Llama Xlam 2 8b Fc R

xLAM-2系列是基於APIGen-MT框架訓練的大型動作模型，專注於多輪對話和函數調用能力，適用於AI代理開發。

大型語言模型

Transformers 英語

Llama Xlam 2 70b Fc R

xLAM-2是SalesforceAIResearch開發的大型動作模型(LAM)系列，專注於將用戶意圖轉化為可執行動作，增強AI代理的決策能力。

大型語言模型

Transformers 英語

Gemma 3 Nine Rings Of Power Fiction Horror 4b It GGUF

基於Google Gemma-3模型，通過9種Neo和恐怖Imatrix方法微調，專注於恐怖和虛構內容生成

大型語言模型英語

Qwen2.5 MOE 2X1.5B DeepSeek Uncensored Censored 4B Gguf

這是一個Qwen2.5 MOE（專家混合）模型，由兩個Qwen 2.5 DeepSeek（審查版/普通版和無審查版）1.5B模型組成，形成一個4B模型，其中無審查版本的DeepSeek Qwen 2.5 1.5B主導模型行為。

大型語言模型支持多種語言

Llama 3.2 11b Vision R1 Distill

Llama 3.2-Vision是由Meta開發的多模態大語言模型，支持圖像和文本輸入，針對視覺識別、圖像推理和描述任務進行了優化。

圖像生成文本

Transformers 支持多種語言

Meta Llama 3.1 8B Instruct FP16

Llama 3.1是Meta開發的多語言大語言模型集合，包含8B、70B和405B參數版本，支持8種語言，針對對話用例優化。

大型語言模型

Safetensors 支持多種語言

Llama SEA LION V3 8B IT

SEA-LION是一系列為東南亞地區預訓練和指令微調的大語言模型，致力於解決該地區多語言處理問題，為東南亞語言的自然語言處理提供強大支持。

大型語言模型

Transformers 支持多種語言

L3.2 Rogue Creative Instruct Uncensored 7B GGUF

基於Llama 3.2架構的7B參數無審查創意寫作模型，支持128k上下文長度，專為小說創作、情節生成和角色扮演優化

大型語言模型英語

Llama 3.2 3B Instruct AWQ

Llama 3.2是Meta推出的多語言大語言模型集合，包含1B和3B參數規模的預訓練和指令調優版本，針對多語言對話用例優化，支持8種官方語言。

大型語言模型

Transformers 支持多種語言

Llama 3.2 3B Instruct

Llama 3.2 是 Meta 推出的多語言大語言模型集合，包含 1B 和 3B 大小的預訓練和指令調優生成模型。它針對多語言對話用例進行了優化，在常見行業基準測試中表現出色。

大型語言模型

Transformers 支持多種語言

Llama 3.2 1B Instruct

Llama 3.2是一組預訓練和指令調優的生成模型，包含1B和3B規模，針對多語言對話用例進行了優化，包括代理檢索和摘要任務。

大型語言模型

Transformers 支持多種語言

Vikhr Nemo 12B Instruct R 21 09 24

Vikhr-Nemo是基於Mistral-Nemo-Instruct-2407優化的雙語大語言模型，專為俄語和英語優化，支持邏輯推理、文本摘要、代碼生成等多種任務。

大型語言模型

Transformers 支持多種語言

Llama 3.2 90B Vision Instruct

Llama 3.2-Vision是Meta開發的多模態大語言模型，支持圖像和文本輸入，文本輸出，在視覺識別、圖像推理、圖像描述和圖像問答任務上表現優異。

圖像生成文本

Transformers 支持多種語言

Llama 3.2 11B Vision

Llama 3.2-Vision是由Meta開發的多模態大語言模型系列，包含11B和90B兩種規模，支持圖像+文本輸入和文本輸出，針對視覺識別、圖像推理、圖像描述和圖像問答任務進行了優化。

圖像生成文本

Transformers 支持多種語言

Llama 3.2是Meta開發的多語言大語言模型系列，包含1B和3B規模的預訓練及指令調優生成模型，針對多語言對話場景優化，支持文本輸入/輸出。

大型語言模型

Transformers 支持多種語言

Llama 3.2 3B Instruct

Llama 3.2是由Meta開發的多語言大語言模型系列，包含1B和3B規模的預訓練及指令調優生成模型，針對多語言對話場景優化。

大型語言模型

Transformers 支持多種語言

Llama 3.2 1B Instruct

Llama 3.2是Meta開發的多語言大語言模型系列，包含1B和3B規模的預訓練及指令調優生成模型，針對多語言對話場景優化，支持智能檢索和摘要任務。

大型語言模型

Transformers 支持多種語言

Llama 3.2是Meta推出的多語言大語言模型系列，包含1B和3B參數的預訓練及指令調優生成模型，針對多語言對話場景優化，支持代理檢索和摘要任務。

大型語言模型

Transformers 支持多種語言

Llama 3.1 8B Instruct GGUF

Meta Llama 3.1 8B Instruct 是一個多語言大語言模型，針對多語言對話用例進行了優化，在常見的行業基準測試中表現優異。

大型語言模型英語

Meta Llama 3.1 是一個多語言大語言模型系列，包含8B、70B和405B三種規模的預訓練及指令調優生成模型，針對多語言對話場景優化。

大型語言模型

Transformers 支持多種語言

Yarn Mistral 7B 128k AWQ

Yarn Mistral 7B 128K是一款針對長上下文優化的先進語言模型，通過YaRN擴展方法在長上下文數據上進一步預訓練，支持128k令牌的上下文窗口。

大型語言模型

Transformers 英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase