C

Chattruth 7B

mingdaliによって開発
ChatTruth-7BはQwen-VLアーキテクチャを最適化した多言語視覚-言語モデルで、高解像度画像処理能力を強化し、還元モジュールを導入して計算コストを削減
ダウンロード数 73
リリース時間 : 12/15/2023

モデル概要

このモデルは中国語と英語の視覚-言語タスクに特化し、革新的なアーキテクチャで高解像度画像処理効率を向上、画像テキスト理解と生成タスクに適応

モデル特徴

高解像度画像処理
高解像度画像の処理能力を大幅に向上、視覚的ディテールの捕捉を最適化
還元モジュール技術
革新的な還元モジュールを導入、高解像度画像処理の計算コストを効果的に削減
バイリンガルサポート
中国語と英語の視覚-言語タスク処理を同時にサポート

モデル能力

画像文字認識
画像テキスト質問応答
マルチモーダル理解
高解像度画像処理

使用事例

ドキュメント処理
画像文字認識
画像からテキスト内容を抽出
出力例:昆明はすごい
インテリジェント質問応答
画像テキスト質問応答
画像内容に基づいて関連質問に回答
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase