I

Indic Seamless

ai4bharatによって開発
SeamlessM4T-v2を微調整したインド言語音声テキスト翻訳モデルで、13のインド言語をサポートし、基本モデルや競合システムを凌駕する性能を発揮します。
ダウンロード数 917
リリース時間 : 3/4/2025

モデル概要

このモデルはインド言語の音声テキスト翻訳(STT)専用で、BhasaAnuvaadデータセットで微調整され、Fleursデータセットで新記録を達成しました。

モデル特徴

多言語サポート
13のインド言語をサポートし、主要なインド語族をカバーします。
高性能
Fleursデータセットで新記録を達成し、BhasaAnuvaadテストセットで他のシステムを大幅に上回りました。
厳格なデータ選別
トレーニング前にデータセットをアライメントスコア(0.8)とマイニングスコア(0.6)の閾値でフィルタリングしました。

モデル能力

音声テキスト翻訳
多言語音声認識
バッチ音声処理

使用事例

音声書き起こし
単一音声書き起こし
単一の音声ファイルを指定したインド言語のテキストに書き起こします
基本モデルや競合システムよりも高い精度を実現
バッチ処理
データセット一括書き起こし
Fleursなどの音声データセットを一括で書き起こし処理します
バッチ処理をサポートし、効率が高い
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase