# 128kコンテキスト

Gemma 3 12B It Qat GGUF
Gemma 3 12B ITはGoogleが開発した大規模言語モデルで、マルチモーダル入力と長いコンテキスト処理をサポートしています。
画像生成テキスト
G
lmstudio-community
36.65k
4
Videochat Flash Qwen2 5 7B InternVideo2 1B
Apache-2.0
InternVideo2-1BとQwen2.5-7Bを基に構築されたマルチモーダル動画テキストモデルで、1フレームあたりわずか16トークンを使用し、最大10,000フレームの入力シーケンスをサポートします。
テキスト生成ビデオ Transformers 英語
V
OpenGVLab
193
4
Videochat Flash Qwen2 7B Res224
Apache-2.0
UMT-LとQwen2-7Bを基に構築されたマルチモーダルモデルで、長い動画の理解をサポートし、1フレームあたりわずか16トークンを使用し、コンテキストウィンドウは128kまで拡張可能です。
ビデオ生成テキスト Transformers 英語
V
OpenGVLab
80
6
Linkbricks Horizon AI Japanese Superb V4 70B
Apache-2.0
Linkbricks Horizon - AIによって開発された日本語強化言語モデルで、70Bのパラメータ規模に基づき、日本語、韓国語、中国語、英語の多言語処理をサポートし、論理推論と多言語タスクに長けています。
大規模言語モデル Transformers 複数言語対応
L
Saxo
912
6
Mixtral AI Vision 128k 7b
MIT
視覚と言語能力を結合したマルチモーダルモデルで、マージ手法により画像とテキストのインタラクション機能を実現します。
画像生成テキスト Transformers 英語
M
LeroyDyer
384
4
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase