Q

Qwen2 Audio 7B Instruct 4bit

alicekytingによって開発
これはQwen2-Audio-7B-Instructの4ビット量子化バージョンで、アリババクラウドのオリジナルQwenモデルに基づいて開発された、オーディオ-テキストマルチモーダル大規模言語モデルです。
ダウンロード数 1,090
リリース時間 : 8/22/2024

モデル概要

このモデルはオーディオとテキストのマルチモーダル入力をサポートし、オーディオコンテンツに関連するテキスト応答を理解・生成できます。4ビット量子化技術によりメモリ使用量が削減され、リソースが限られたハードウェアでの使用に適しています。

モデル特徴

4ビット量子化技術
メモリ使用量を削減し、リソースが限られたハードウェアでより効率的な推論を実現
マルチモーダル理解
オーディオとテキスト入力を同時に処理し、クロスモーダル理解を実現
対話インタラクション
マルチターン対話をサポートし、コンテキストの一貫性を保持

モデル能力

オーディオコンテンツ理解
テキスト生成
マルチターン対話
クロスモーダル推論

使用事例

インテリジェントアシスタント
オーディオコンテンツQ&A
ユーザーがオーディオファイルをアップロードし、オーディオ内容に関する質問を行う
モデルはオーディオ内容を正確に理解し、関連する回答を提供できる
教育アプリケーション
言語学習支援
音声発音を分析しフィードバックを提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase