128K長文本推理

# 128K長文本推理

Llama 3 3 Nemotron Super 49B V1 GGUF

Llama-3.3-Nemotron-Super-49B-v1 是一個大型語言模型，基於 Meta Llama-3.3-70B-Instruct 改進，增強了推理能力、人類聊天偏好以及任務執行能力，支持 128K tokens 的上下文長度。

大型語言模型

Transformers 英語

Llama 3.1 Nemotron Nano 8B V1 GGUF

Llama-3.1-Nemotron-Nano-8B-v1是基於Meta Llama-3.1-8B-Instruct的推理模型，經過後訓練增強推理能力、人類聊天偏好及任務執行能力。

大型語言模型

Transformers 英語

Llama 3 1 Nemotron Ultra 253B CPT V1

Llama-3.1-Nemotron-Ultra-253B-CPT-v1是基於Meta Llama-3.1-405B-Instruct的大型語言模型，支持128K tokens上下文長度，經過神經架構搜索優化，在準確性和效率之間取得良好平衡。

大型語言模型

Transformers 英語

Llama 3 3 Nemotron Super 49B V1

Llama-3.3-Nemotron-Super-49B-v1是基於Meta Llama-3.3-70B-Instruct的大型語言模型，專注於推理、對話偏好和任務執行，支持128K tokens上下文長度。

大型語言模型

Transformers 英語

DeepSeek-R1是深度求索推出的第一代推理模型，通過大規模強化學習訓練，在數學、代碼和推理任務上表現優異。

大型語言模型

GLM-4-9B是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本，在語義、數學、推理、代碼和知識等數據集評估中表現出色，具備多語言支持等先進特性。

大型語言模型

Safetensors 支持多種語言

Glm 4 9b Chat Hf

GLM-4-9B是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本，具備卓越的語義、數學、推理、代碼和知識能力。

大型語言模型

Transformers 支持多種語言

Phi 3.5 Mini Instruct

Phi-3.5-mini 是一個輕量級、最先進的開源模型，基於 Phi-3 使用的數據集構建，支持 128K 的上下文長度，特別注重高質量、富含推理能力的數據。

大型語言模型

Transformers 其他

GLM-4-9B是智譜AI推出的最新開源預訓練模型，在多項基準測試中超越Llama-3-8B，支持128K上下文長度和26種語言。

大型語言模型

Transformers 支持多種語言

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase