R

Ru Whisper Small

Val123valによって開発
openai/whisper-smallをベースにファインチューニングしたロシア語音声認識モデル、Sberdevices_golos_10h_crowdデータセットでトレーニング
ダウンロード数 43
リリース時間 : 12/28/2023

モデル概要

ロシア語に最適化された音声認識モデル、自動音声書き起こしタスクに適応

モデル特徴

ロシア語最適化
ロシア語音声データに特化してファインチューニング、認識精度を向上
長時間音声処理
30秒を超える長時間音声をチャンクアルゴリズムで処理可能
タイムスタンプ予測
音声認識結果にタイムスタンプ情報を返却可能
推論デコードサポート
補助モデルを使用して推論プロセスを高速化可能

モデル能力

ロシア語音声認識
長時間音声書き起こし
タイムスタンプ予測

使用事例

音声書き起こし
ロシア語会議議事録
ロシア語会議内容を自動書き起こし
ロシア語メディアコンテンツ字幕生成
ロシア語動画に自動字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase