# GUIエージェント

Internvl3 8B
Apache-2.0
InternVL3-8Bは、高度なマルチモーダル大規模言語モデルで、卓越したマルチモーダル感知と推論能力を備え、画像や動画などのマルチモーダルデータを処理できます。
マルチモーダルアライメント Transformers
I
unsloth
224
1
Internvl3 1B GGUF
Apache-2.0
InternVL3-1Bは、高度なマルチモーダル大規模言語モデルであり、マルチモーダル感知や推論などの能力に優れており、ツール使用やGUIエージェントなどのマルチモーダル能力も拡張されています。
マルチモーダル融合 Transformers
I
unsloth
868
2
Internvl3 14B Hf
その他
InternVL3-14Bは強力なマルチモーダル大規模言語モデルで、マルチモーダル認知と推論能力に優れ、画像、テキスト、ビデオなどの複数の入力をサポートします。
画像生成テキスト Transformers その他
I
OpenGVLab
4,260
0
Internvl3 8B Instruct
その他
InternVL3-8B-Instruct は先進的なマルチモーダル大規模言語モデル(MLLM)で、優れたマルチモーダル知覚と推論能力を示し、ツール使用、GUIエージェント、産業画像分析、3D視覚知覚など多様な機能をサポートします。
画像生成テキスト Transformers その他
I
OpenGVLab
885
2
Internvl3 8B
その他
InternVL3-8Bは、高度なマルチモーダル大規模言語モデルで、卓越したマルチモーダル感知と推論能力を備え、ツール使用、GUIエージェント、産業用画像分析などの多くの分野で優れた性能を発揮します。
マルチモーダル融合 Transformers その他
I
FriendliAI
167
0
UI TARS 2B SFT
Apache-2.0
UI-TARSは次世代のネイティブグラフィカルユーザーインターフェース(GUI)エージェントモデルで、人間のような知覚、推論、行動能力を通じてGUIとシームレスにインタラクションすることを目的としています。
画像生成テキスト Transformers 複数言語対応
U
ByteDance-Seed
5,553
19
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase