高性价比
Pangu NLP N1 128K 3.2.36
P

Pangu NLP N1 128K 3.2.36

由Huawei开发
更新时间:
2025-01-01
Pangu-NLP-N1-128K-3.2.36 是华为云于2025年1月发布的自然语言处理模型,支持128K序列长度推理,4个推理单元可实现8并发。该模型需通过全量微调或LoRA微调(8个训练单元起训)后部署,适用于长文本处理场景。
文本生成中文,英文

模型定价

输入
按需计费
元/百万tokens
输出
按需计费
元/百万tokens

模型能力

输入类型
输出类型
Function Call
Session缓存
模型精调
前缀缓存
结构化输出

模型参数

上下文窗口
128k
模型更新时间
2025-11-28
开源分类
非开源
多模态支持
文本
最大输入Token长度
128k
最大生成Token长度
32k

同类模型推荐

G
GPT 4.1 Mini
文本生成多语言工具调用
GPT-4.1 mini是OpenAI推出的中小型多模态模型,支持百万token上下文,可处理文本、图像及视频。性能媲美GPT-4o,MMMU测试得分73%超前代,延迟降半、成本减83%,适用于开发者API调用,处理长内容与视觉任务。
Openai
更新时间:
2025-11-11
G
Gemini 2.0 Flash Lite
文本生成多语言工具调用
Gemini 2.0 Flash Lite 是 Gemini 2.0 系列中速度最快的模型,经过优化以实现更高的成本效益和更低的延迟。它旨在处理高吞吐量的轻量级任务,并支持多模态输入(如图片、文档和音频),具有巨大的输入 token 上限
Google
更新时间:
2025-11-11
G
Grok 4 Fast
文本生成多语言
Grok 4 Fast是xAI于2025年推出的大语言模型轻量版本,主打高速推理与成本优化。其核心特点包括:每秒75 token生成速度(较标准版快10倍),200万token超长上下文窗口,支持整本书籍或代码库一次性处理;推理成本降低98%,通过优化架构减少40%推理tokens消耗。作为Grok 4系列基础版本,它集成文本/图像输入、实时网络访问(DeepSearch工具)及函数调用能力,面向日常问答、文档处理等轻量化场景,计划逐步替代Grok 3成为免费用户基础服务。该模型在保持多模态能力的同时,以效率优先设计适配普通用户需求。
Xai
更新时间:
2025-11-10
O
O3 Mini
文本生成多语言工具调用
OpenAI o3-mini是2025年1月推出的小型推理模型,定位STEM领域专业化方案,支持函数调用、结构化输出等高级开发者功能,提供低/中/高推理级别以平衡精度与效率,适用于科学计算、编程开发等场景,兼具低成本与低延迟特性。
Openai
更新时间:
2025-11-08
G
GPT 5 Codex
文本生成多语言
GPT-5 Codex是OpenAI推出的多模型混合代码生成系统,整合高效基础模型与深度推理模块,通过智能路由动态调度资源。其代码生成能力显著提升,可快速构建复杂前端应用、调试大型代码库,支持单提示生成完整网站和游戏,在设计美学处理上更优。适用于编程开发、应用构建及代码调试场景,免费用户可基础使用,付费版提供更高限额与扩展推理能力。
Openai
更新时间:
2025-11-07
C
Claude 3 Opus
文本生成多语言工具调用
Claude 3 Opus是Anthropic推出的顶级大模型,属Claude 3系列高端版本,具备多模态能力,支持20万Token上下文窗口。特点为智能水平领先,在MMLU、GPQA等基准测试中表现超同类,能深度理解复杂任务,实现类人交互。适用于任务自动化(API/数据库操作)、研发(药物研发、研究审查)、战略分析(财务趋势预测、图表解读)等场景。
Anthropic
更新时间:
2025-11-04
AIBase
智启未来,您的人工智能解决方案智库
© 2026AIBase