S

Shuka 1

sarvamaiによって開発
Shuka v1は、インド言語の音声理解をネイティブサポートする言語モデルで、独自開発の音声エンコーダーとLlama3-8B-Instructデコーダーを組み合わせ、多言語ゼロショットQAタスクをサポートします。
ダウンロード数 729
リリース時間 : 8/8/2024

モデル概要

Shuka v1は、インド言語向けに設計された音声テキスト変換モデルで、英語とヒンディー語をサポートし、その他のインド言語でも優れた性能を発揮します。

モデル特徴

多言語サポート
英語とヒンディー語をネイティブサポートし、その他のインド言語でも優れた性能を発揮します。
効率的なトレーニング
わずか100時間未満の音声データを使用してトレーニングし、プロジェクターの重みのみをファインチューニングします。
ゼロショットQA
他のインド言語のゼロショットQAタスクで優れた性能を発揮します。

モデル能力

音声テキスト変換
多言語音声理解
ゼロショットQA

使用事例

音声認識
ヒンディー語音声テキスト変換
ヒンディー語の音声をテキストに変換
高精度なテキスト出力
多言語QA
多言語ゼロショットQA
特別にトレーニングされていない言語でQAタスクを実行
優れた性能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase