最新发布

AIモデルファインダー

Hunyuan T1 Vision

Hunyuan T1 Vision

Tencentによって開発

更新時間：

2025-06-19

Hunyuan-T1-Visionは騰訊混元が発表したマルチモーダルなビジュアル理解モデルで、マルチモーダルな原生思考チェーン技術を融合し、「画像を見て思考する」能力を実現し、応答速度が1.5倍向上しました。画像を深く解析でき、例えばチップの型番を識別して開発コスト表を生成し、花卉、囲碁の盤面、預金利率表などの多くのシーンの識別と分析もサポートしており、すでに元宝プラットフォームに登録されています。

全モーダリティ中国語,英語

モデルパラメータ比較トークンコスト計算モデル結果評価

モデル価格設定

入力

3

元/百万トークン

出力

9

元/百万トークン

モデル能力

入力タイプ

出力タイプ

Function Call

セッションキャッシュ

モデル微調整

プレフィックスキャッシュ

構造化出力

モデルパラメータ

コンテキストウィンドウ

16k

モデル更新時間

2025-11-28

オープンソースカテゴリ

クローズドソース

マルチモーダルサポート

ビジュアル,テキスト

最大入力トークン長

16k

最大出力トークン長

24k

ベンチマークスコア

以下はの様々な標準ベンチマークテストでのパフォーマンスです。これらのテストは、異なるタスクやドメインにおけるモデルの能力を評価します。

Math 500スコア

最初の500の大規模でよく知られた数学ベンチマークテストのスコア

96.2

最初の500の大規模でよく知られた数学ベンチマークテストのスコア

数学指数

数学的問題の解決、数学的推論、または数学関連タスクの実行における能力指標

87.31

数学的問題の解決、数学的推論、または数学関連タスクの実行における能力指標

MMLU Pro

大規模マルチタスクマルチモーダル理解 - テキスト、画像、音声、ビデオの理解をテスト

87.2

大規模マルチタスクマルチモーダル理解 - テキスト、画像、音声、ビデオの理解をテスト

AIMEスコア

高難度の数学競技問題（特にAIMEレベル）を解決するAIモデルの能力を測定する指標

78.2

高難度の数学競技問題（特にAIMEレベル）を解決するAIモデルの能力を測定する指標

コーディング指数

コーディングタスクにおけるAIモデルのパフォーマンス指標

77.94

コーディングタスクにおけるAIモデルのパフォーマンス指標

GPQA

大学院物理学問題評価 - ダイヤモンド科学レベルの問題で高度な物理学知識をテスト

69.3

大学院物理学問題評価 - ダイヤモンド科学レベルの問題で高度な物理学知識をテスト

LiveCodeBench

実世界のコード作成とプログラミングコンテスト問題解決における大規模言語モデルの能力を評価する特定の評価

64.9

実世界のコード作成とプログラミングコンテスト問題解決における大規模言語モデルの能力を評価する特定の評価

類似モデル推奨

Gemini 2.0 Flash Lite

テキスト生成マルチ言語ツール呼び出し

Gemini 2.0 Flash Liteは、Gemini 2.0シリーズの中で最も高速なモデルで、より高いコスト効率と低遅延を実現するために最適化されています。高スループットの軽量級タスクを処理することを目的としており、画像、ドキュメント、音声などのマルチモーダル入力をサポートし、非常に大きな入力トークン上限を持っています。

更新時間：

テキスト生成多言語ツール呼び出し

GPT-4.1 miniはOpenAIが発表した中小型のマルチモーダルモデルで、100万トークンのコンテキストをサポートし、テキスト、画像、ビデオを処理できます。性能はGPT-4oに匹敵し、MMMUテストのスコアは73%で前代を上回り、遅延は半減し、コストは83%削減されます。開発者がAPIを呼び出して長いコンテンツとビジュアルタスクを処理するのに適しています。

更新時間：

テキスト生成多言語

Grok 4 Fastは、xAIが2025年にリリースした大規模言語モデルの軽量版で、高速推論とコスト最適化を主な特長としています。その核心的な特徴は以下の通りです：毎秒75トークンの生成速度（標準版より10倍速い）、200万トークンの超長文脈ウィンドウで、1冊の本やコードライブラリを一度に処理できます；推論コストが98％削減され、アーキテクチャを最適化することで推論トークンの消費量を40％削減しています。Grok 4シリーズの基礎版として、テキスト/画像入力、リアルタイムのウェブアクセス（DeepSearchツール）、関数呼び出し機能を統合しており、日常の質問応答や文書処理などの軽量なシナリオを対象としています。無料ユーザーの基本サービスとしてGrok 3を徐々に置き換える予定です。このモデルは、マルチモーダル機能を維持しながら、一般ユーザーのニーズに合わせて効率を優先した設計となっています。

更新時間：

テキスト生成多言語ツール呼び出し

OpenAIのo3 - miniは2025年1月にリリースされた小型推論モデルで、STEM分野の専門化されたソリューションを目指しています。関数呼び出しや構造化出力などの高度な開発者機能をサポートし、精度と効率をバランスさせるために低/中/高の推論レベルを提供します。科学計算やプログラミング開発などのシナリオに適しており、低コストと低遅延の特性を兼ね備えています。

更新時間：

テキスト生成多言語

GPT-5 CodexはOpenAIが開発した多モデル混合コード生成システムで、高効率な基礎モデルと深度推論モジュールを統合し、インテリジェントルーティングによってリソースを動的に調整します。コード生成能力が大幅に向上し、複雑なフロントエンドアプリケーションを迅速に構築したり、大規模なコードベースをデバッグしたりできます。単一のプロンプトで完全なウェブサイトやゲームを生成することも可能で、デザイン美学の処理にも優れています。プログラミング開発、アプリケーション構築、コードデバッグのシナリオに適しており、無料ユーザーは基本的な機能を利用でき、有料版ではより高い制限と拡張された推論能力を提供します。

更新時間：

テキスト生成多言語ツール呼び出し

Claude 3 OpusはAnthropicが開発したトップクラスの大規模モデルで、Claude 3シリーズのハイエンドバージョンに属し、マルチモーダル機能を備え、20万Tokenのコンテキストウィンドウをサポートしています。特徴は、高度な知能レベルで、MMLUやGPQAなどのベンチマークテストで同類を上回る成績を収め、複雑なタスクを深く理解し、人間に近い対話を実現できます。タスク自動化（API/データベース操作）、研究開発（医薬品開発、研究レビュー）、戦略分析（財務トレンド予測、グラフ解釈）などのシナリオに適しています。

更新時間：

AIBase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2026AIBase