nvidia.Cosmos-Reason1-7B-GGUFオープンソースモデル - 画像とテキストの効率的な変換を無料で実現

ホーム

Nvidia.cosmos Reason1 7B GGUF

DevQuasarによって開発

Cosmos-Reason1-7BはNVIDIAがリリースした70億パラメータ規模のベースモデルで、画像からテキストへの変換タスクに特化しています。

大規模言語モデル #画像推論 #マルチモーダル理解 #知識伝播

ダウンロード数 287

リリース時間 : 5/22/2025

モデル概要

このモデルは主に画像からテキストへの変換タスクを処理するために使用され、画像内容に関連するテキスト記述を理解し生成できます。

モデル特徴

マルチモーダル理解

画像とテキスト情報を同時に処理し、画像からテキストへの変換タスクを実現できます。

70億パラメータ規模

中規模のモデルで、性能と計算リソース要件のバランスが取れています。

モデル能力

画像からテキストへの変換

マルチモーダル理解

使用事例

コンテンツ生成

画像キャプション生成

入力画像に基づいて対応するテキスト記述を生成します。

支援ツール

視覚的質問応答

画像内容に関連する質問に回答します。

属性	详情
ベースモデル	nvidia/Cosmos-Reason1-7B
パイプラインタグ	画像テキストからテキストへ

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Nvidia.cosmos Reason1 7B GGUF

モデル概要

モデル特徴

モデル能力

使用事例

🚀 画像テキストからテキストへのモデル

📦 モデル情報