W

Whisper Large V3 Russian Ties Podlodka V1.2

Apel-sinによって開発
TIES融合手法に基づくロシア語音声認識モデル。2つのWhisper-large-v3ロシア語バリアントを統合し、電話録音シナリオに最適化
ダウンロード数 2,408
リリース時間 : 4/2/2025

モデル概要

このモデルはTIES融合手法により2つのロシア語Whisperモデルを統合し、ロシア語音声認識精度の向上に焦点を当て、特に電話通話シナリオでの認識性能を最適化

モデル特徴

TIES融合技術
先進的なTIESモデル融合手法を採用、疎密度0.9、エンコーダ/デコーダの差異化重み割り当て(0.8/0.2と0.2/0.8)
電話シナリオ最適化
電話録音シナリオに特化して最適化、オーディオ前処理プロセスとの併用を推奨
多データセット訓練
Common Voice 17.0、Taiga Speech、Podlodkaなど複数のロシア語音声データセットを融合

モデル能力

ロシア語音声テキスト変換
長音声チャンク処理
タイムスタンプ生成
低リソースデバイスサポート

使用事例

音声転写
電話録音転記
ロシア語電話通話内容を文字記録に変換
電話音声に最適化された認識精度
会議記録生成
ロシア語会議音声の文字記録を自動生成
長音声チャンク処理をサポート
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase