A

Audiox South V1

jiviaiによって開発
AudioXはJivi AIが開発した多言語自動音声認識モデルで、特にインド南部の言語に最適化されており、タミル語、テルグ語、カンナダ語、マラヤーラム語をサポートしています。
ダウンロード数 148
リリース時間 : 1/20/2025

モデル概要

AudioXはJivi AIが開発した先進的なインド多言語自動音声認識モデルシリーズで、北部版と南部版の2つのバリアントがあります。南部版はタミル語、テルグ語、カンナダ語、マラヤーラム語に最適化されており、高精度な音声転写能力を提供します。

モデル特徴

多言語サポート
インド南部の4つの主要言語(タミル語、テルグ語、カンナダ語、マラヤーラム語)に特化して最適化されています。
高精度
Vistaarベンチマークテストで優れた性能を発揮し、単語誤り率(WER)はほとんどの商用およびオープンソースASRモデルを下回っています。
頑健性
ノイズ増強トレーニングにより、様々な音響条件やアクセント下でも良好な性能を維持できます。

モデル能力

音声からテキストへの変換
多言語認識
自動言語検出

使用事例

音声アシスタント
多言語音声アシスタント
インド南部ユーザー向けに現地言語で対話可能な音声アシスタントを提供
ユーザー体験と対話精度の向上
転写サービス
医療記録転写
医師と患者の会話をテキスト記録に転写
医療記録の効率と精度向上
カスタマーサービス
自動カスタマーサポートシステム
複数のインド南部言語での顧客問い合わせを処理
運用コスト削減とサービスカバレッジ拡大
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase