高性价比

Pangu NLP N1 128K 3.2.36

Pangu NLP N1 128K 3.2.36

由Huawei开发

更新时间：

2025-01-01

Pangu-NLP-N1-128K-3.2.36 是华为云于2025年1月发布的自然语言处理模型，支持128K序列长度推理，4个推理单元可实现8并发。该模型需通过全量微调或LoRA微调（8个训练单元起训）后部署，适用于长文本处理场景。

文本生成中文,英文

模型参数对比 token费用计算模型结果评测

模型定价

输入

按需计费

元/百万tokens

输出

按需计费

元/百万tokens

模型能力

输入类型

输出类型

Function Call

Session缓存

模型精调

前缀缓存

结构化输出

模型参数

上下文窗口

128k

模型更新时间

2025-11-28

开源分类

非开源

多模态支持

文本

最大输入Token长度

128k

最大生成Token长度

32k

同类模型推荐

文本生成多语言工具调用

GPT-4.1 mini是OpenAI推出的中小型多模态模型，支持百万token上下文，可处理文本、图像及视频。性能媲美GPT-4o，MMMU测试得分73%超前代，延迟降半、成本减83%，适用于开发者API调用，处理长内容与视觉任务。

更新时间：

Gemini 2.0 Flash Lite

文本生成多语言工具调用

Gemini 2.0 Flash Lite 是 Gemini 2.0 系列中速度最快的模型，经过优化以实现更高的成本效益和更低的延迟。它旨在处理高吞吐量的轻量级任务，并支持多模态输入（如图片、文档和音频），具有巨大的输入 token 上限

更新时间：

文本生成多语言

Grok 4 Fast是xAI于2025年推出的大语言模型轻量版本，主打高速推理与成本优化。其核心特点包括：每秒75 token生成速度（较标准版快10倍），200万token超长上下文窗口，支持整本书籍或代码库一次性处理；推理成本降低98%，通过优化架构减少40%推理tokens消耗。作为Grok 4系列基础版本，它集成文本/图像输入、实时网络访问（DeepSearch工具）及函数调用能力，面向日常问答、文档处理等轻量化场景，计划逐步替代Grok 3成为免费用户基础服务。该模型在保持多模态能力的同时，以效率优先设计适配普通用户需求。

更新时间：

文本生成多语言工具调用

OpenAI o3-mini是2025年1月推出的小型推理模型，定位STEM领域专业化方案，支持函数调用、结构化输出等高级开发者功能，提供低/中/高推理级别以平衡精度与效率，适用于科学计算、编程开发等场景，兼具低成本与低延迟特性。

更新时间：

文本生成多语言

GPT-5 Codex是OpenAI推出的多模型混合代码生成系统，整合高效基础模型与深度推理模块，通过智能路由动态调度资源。其代码生成能力显著提升，可快速构建复杂前端应用、调试大型代码库，支持单提示生成完整网站和游戏，在设计美学处理上更优。适用于编程开发、应用构建及代码调试场景，免费用户可基础使用，付费版提供更高限额与扩展推理能力。

更新时间：

文本生成多语言工具调用

Claude 3 Opus是Anthropic推出的顶级大模型，属Claude 3系列高端版本，具备多模态能力，支持20万Token上下文窗口。特点为智能水平领先，在MMLU、GPQA等基准测试中表现超同类，能深度理解复杂任务，实现类人交互。适用于任务自动化（API/数据库操作）、研发（药物研发、研究审查）、战略分析（财务趋势预测、图表解读）等场景。

更新时间：

AIBase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2026AIBase