W

Whisper Hindi2Hinglish Swift

Oriserveによって開発
Whisperアーキテクチャを基に最適化されたヒンディー語-ヒンディー英語混合音声認識モデル、インド訛りとノイズ環境向けに特別設計
ダウンロード数 496
リリース時間 : 1/7/2025

モデル概要

このモデルはWhisper-baseのファインチューニング版で、ヒンディー語音声を口語的なヒンディー英語混合テキストに変換することに特化しており、インド地域の音声認識シナリオに適しています

モデル特徴

ヒンディー英語混合言語サポート
音声を口語的なヒンディー英語混合テキストに変換する機能を追加、文法エラーの発生率を低減
ノイズ環境最適化
インドで一般的な背景ノイズ環境向けに特別最適化、騒がしい状況での認識精度向上
幻覚抑制
トレーニング技術により転写時の幻覚現象を最小化、出力テキストの正確性向上
動的レイヤーフリーズ技術
革新的なトレーニング技術により迅速な収束と効率的なファインチューニングを実現

モデル能力

ヒンディー語音声認識
ヒンディー英語混合テキスト生成
ノイズ環境下での音声転写
長音声処理

使用事例

音声文字起こしサービス
コールセンター通話記録
インド地域のカスタマーサポート通話内容を文字記録に変換
ノイズ環境下でも高い認識精度を維持
会議議事録
ヒンディー英語混合の会議議事録を自動生成
複数人対話シーンに対応
音声アシスタント
ローカライズ音声コマンド認識
インド地域ユーザー向けに精度の高い音声コマンド認識を提供
ヒンディー英語混合口語表現に対応
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase