I

Internvl2 5 1B GGUF BPU

Developed by D-Robotics
InternVL2_5 - 1Bは、画像テキストからテキストへの変換に基づくマルチモーダル大規模モデルで、ビジュアル言語タスクに適しています。
Downloads 167
Release Time : 2/21/2025

Model Overview

このモデルは主に画像とテキスト間の変換タスクを処理するために使用され、画像内容を理解して関連するテキスト記述を生成することができます。

Model Features

マルチモーダルサポート
画像とテキストの入力を同時に処理し、クロスモーダルの理解と生成を実現します。
高効率推論
BPUハードウェア上で最適化された動作を行い、高効率な推論性能を提供します。
軽量化
10億パラメータの規模は比較的小さく、リソースが限られたデバイスに適しています。

Model Capabilities

画像理解
テキスト生成
クロスモーダル変換

Use Cases

画像記述生成
自動画像アノテーション
画像に記述的なテキストを生成し、画像検索や視覚障害者の支援に使用します。
正確かつ関連性のある画像記述を生成します。
ビジュアル質問応答
画像ベースの質問応答システム
画像内容に関する自然言語の質問に回答します。
正確な回答を提供し、ユーザーが画像内容を理解するのを助けます。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase