A

Audiox North V1

jiviaiによって開発
AudioXはJivi AIが開発した多言語自動音声認識モデルで、ヒンディー語、グジャラート語、マラーティー語などインドの言語に最適化されています。
ダウンロード数 810
リリース時間 : 2/16/2025

モデル概要

AudioXはインドの言語向けに設計された自動音声認識モデルシリーズで、異なる言語グループに最適化されたバリエーションを含み、高精度な音声からテキストへの変換サービスを提供します。

モデル特徴

多言語サポート
ヒンディー語、グジャラート語、マラーティー語など複数のインド言語をサポートするよう特別に最適化
高精度
Vistaar Benchmarkで優れた性能を発揮し、複数の商用ASRモデルを凌駕
頑健性
異なる地域のアクセントや音響条件下の音声入力を処理可能
混合トレーニングデータ
オープンソースASRコーパスと独自の医療データセットを組み合わせてトレーニング

モデル能力

音声からテキストへの変換
多言語音声認識
アクセント適応

使用事例

音声アシスタント
多言語音声インタラクション
インドの多言語ユーザー向けに音声インタラクションをサポート
転写サービス
医療記録転写
医師と患者の会話をテキスト記録に転写
カスタマーサービス
自動化カスタマーサポートシステム
多言語顧客の音声クエリを処理
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase