Qwen2.5-Omni-7B-GGUFオープンソースマルチモーダルモデル - テキスト、オーディオ、画像入力に対応

ホーム

Qwen2.5 Omni 7B GGUF

ggml-orgによって開発

Qwen2.5-Omni-7B-GGUF は Qwen2.5-Omni-7B モデルの GGUF フォーマット版で、テキスト、音声、画像を含むマルチモーダル入力をサポートします。

大規模言語モデル英語オープンソースライセンス:その他 #マルチモーダル入力 #軽量展開 #クロスモーダル理解

ダウンロード数 319

リリース時間 : 5/26/2025

モデル概要

このモデルはマルチモーダルモデルで、テキスト、音声、画像入力を処理でき、テキスト生成、画像理解、音声認識などの多様なタスクに適用可能です。

モデル特徴

マルチモーダルサポート

テキスト、音声、画像入力をサポートし、多様なモーダルのタスク処理に適しています。

効率的な推論

GGUF フォーマットを採用し、モデルの推論効率を最適化しました。

幅広い適用性

テキスト生成、画像理解、音声認識などの多様なタスクに適用可能です。

モデル能力

テキスト生成

画像分析

音声認識

使用事例

自然言語処理

テキスト生成

一貫性のあるテキストコンテンツを生成し、チャットボットやコンテンツ作成などのシナリオに適しています。

コンピュータビジョン

画像理解

画像内容を分析し、関連する説明を生成したり、画像に関する質問に答えたりします。

音声処理

音声認識

音声入力をテキストに変換し、音声から文字への変換などのアプリケーションに適しています。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Qwen2.5 Omni 7B GGUF

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Qwen2.5-Omni-7B-GGUF

🚀 クイックスタート

📄 ライセンス