ChatTruth-7Bオープンソース多言語視覚言語モデル - 高解像度画像を効率的に処理し、計算コストを削減

ホーム

Chattruth 7B

mingdaliによって開発

ChatTruth-7BはQwen-VLアーキテクチャを最適化した多言語視覚-言語モデルで、高解像度画像処理能力を強化し、還元モジュールを導入して計算コストを削減

画像生成テキスト

Transformers

複数言語対応#高解像度画像処理 #マルチモーダル質問応答 #中国語最適化

ダウンロード数 73

リリース時間 : 12/15/2023

モデル概要

このモデルは中国語と英語の視覚-言語タスクに特化し、革新的なアーキテクチャで高解像度画像処理効率を向上、画像テキスト理解と生成タスクに適応

モデル特徴

高解像度画像処理

高解像度画像の処理能力を大幅に向上、視覚的ディテールの捕捉を最適化

還元モジュール技術

革新的な還元モジュールを導入、高解像度画像処理の計算コストを効果的に削減

バイリンガルサポート

中国語と英語の視覚-言語タスク処理を同時にサポート

モデル能力

画像文字認識

画像テキスト質問応答

マルチモーダル理解

高解像度画像処理

使用事例

ドキュメント処理

画像文字認識

画像からテキスト内容を抽出

出力例：昆明はすごい

インテリジェント質問応答

画像テキスト質問応答

画像内容に基づいて関連質問に回答

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Chattruth 7B

モデル概要

モデル特徴

モデル能力

使用事例

🚀 ChatTruth-7B

📦 インストール

🚀 クイックスタート

基本的な使用法