
Qwen Flash
Alibabaによって開発
更新時間:
2025-08-05
Qwen-Flashはアリババの通義研究所が発表したQwen3シリーズの高性能軽量級モデルで、一般的なタスクの処理、論理推論、中英語の理解を最適化し、百万文字のコンテキストをサポートし、応答速度が速く、コストが低く、スマートカスタマーサービス、コンテンツ生成、ドキュメント分析、スマートエージェントアプリケーションに適しており、すでに阿里云百錬プラットフォームに上线しています。
テキスト生成ツール呼び出し
モデル価格設定
入力
15
元/百万トークン
出力
15
元/百万トークン
バッチ推論入力
7.5
元/百万トークン
バッチ推論出力
7.5
元/百万トークン
キャッシュヒット
3
元/百万トークン
モデル能力
入力タイプ
出力タイプ
Function Call
セッションキャッシュ
モデル微調整
プレフィックスキャッシュ
構造化出力
モデルパラメータ
コンテキストウィンドウ
1024k
モデル更新時間
2025-11-28
最大入力トークン長
997k
最大出力トークン長
32k
TPM
10000k
RPM
15k
類似モデル推奨

Gemini 2.0 Flash Lite
テキスト生成マルチ言語ツール呼び出し
Gemini 2.0 Flash Liteは、Gemini 2.0シリーズの中で最も高速なモデルで、より高いコスト効率と低遅延を実現するために最適化されています。高スループットの軽量級タスクを処理することを目的としており、画像、ドキュメント、音声などのマルチモーダル入力をサポートし、非常に大きな入力トークン上限を持っています。
Google
更新時間:
2025-11-11

GPT 4.1 Mini
テキスト生成多言語ツール呼び出し
GPT-4.1 miniはOpenAIが発表した中小型のマルチモーダルモデルで、100万トークンのコンテキストをサポートし、テキスト、画像、ビデオを処理できます。性能はGPT-4oに匹敵し、MMMUテストのスコアは73%で前代を上回り、遅延は半減し、コストは83%削減されます。開発者がAPIを呼び出して長いコンテンツとビジュアルタスクを処理するのに適しています。
Openai
更新時間:
2025-11-11

Grok 4 Fast
テキスト生成多言語
Grok 4 Fastは、xAIが2025年にリリースした大規模言語モデルの軽量版で、高速推論とコスト最適化を主な特長としています。その核心的な特徴は以下の通りです:毎秒75トークンの生成速度(標準版より10倍速い)、200万トークンの超長文脈ウィンドウで、1冊の本やコードライブラリを一度に処理できます;推論コストが98%削減され、アーキテクチャを最適化することで推論トークンの消費量を40%削減しています。Grok 4シリーズの基礎版として、テキスト/画像入力、リアルタイムのウェブアクセス(DeepSearchツール)、関数呼び出し機能を統合しており、日常の質問応答や文書処理などの軽量なシナリオを対象としています。無料ユーザーの基本サービスとしてGrok 3を徐々に置き換える予定です。このモデルは、マルチモーダル機能を維持しながら、一般ユーザーのニーズに合わせて効率を優先した設計となっています。
Xai
更新時間:
2025-11-10

O3 Mini
テキスト生成多言語ツール呼び出し
OpenAIのo3 - miniは2025年1月にリリースされた小型推論モデルで、STEM分野の専門化されたソリューションを目指しています。関数呼び出しや構造化出力などの高度な開発者機能をサポートし、精度と効率をバランスさせるために低/中/高の推論レベルを提供します。科学計算やプログラミング開発などのシナリオに適しており、低コストと低遅延の特性を兼ね備えています。
Openai
更新時間:
2025-11-08

GPT 5 Codex
テキスト生成多言語
GPT-5 CodexはOpenAIが開発した多モデル混合コード生成システムで、高効率な基礎モデルと深度推論モジュールを統合し、インテリジェントルーティングによってリソースを動的に調整します。コード生成能力が大幅に向上し、複雑なフロントエンドアプリケーションを迅速に構築したり、大規模なコードベースをデバッグしたりできます。単一のプロンプトで完全なウェブサイトやゲームを生成することも可能で、デザイン美学の処理にも優れています。プログラミング開発、アプリケーション構築、コードデバッグのシナリオに適しており、無料ユーザーは基本的な機能を利用でき、有料版ではより高い制限と拡張された推論能力を提供します。
Openai
更新時間:
2025-11-07

Claude 3 Opus
テキスト生成多言語ツール呼び出し
Claude 3 OpusはAnthropicが開発したトップクラスの大規模モデルで、Claude 3シリーズのハイエンドバージョンに属し、マルチモーダル機能を備え、20万Tokenのコンテキストウィンドウをサポートしています。特徴は、高度な知能レベルで、MMLUやGPQAなどのベンチマークテストで同類を上回る成績を収め、複雑なタスクを深く理解し、人間に近い対話を実現できます。タスク自動化(API/データベース操作)、研究開発(医薬品開発、研究レビュー)、戦略分析(財務トレンド予測、グラフ解釈)などのシナリオに適しています。
Anthropic
更新時間:
2025-11-04