W

Wav2vec2 Large Multilang Cv Ru

cuttenによって開発
このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットでファインチューニングしたバージョンで、主にロシア語音声認識タスクに使用されます。
ダウンロード数 16
リリース時間 : 6/8/2022

モデル概要

これはロシア語に最適化された音声認識モデルで、wav2vec2アーキテクチャに基づき、common_voiceデータセットでファインチューニングされています。

モデル特徴

多言語事前学習ベース
facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングされており、このモデルは複数言語で事前学習済みです
ロシア語最適化
ロシア語音声認識タスクに特化して最適化されています
オープンソースライセンス
Apache 2.0ライセンスを使用しており、商用・研究用途が可能です

モデル能力

ロシア語音声認識
音声テキスト変換

使用事例

音声文字起こし
ロシア語音声文字起こし
ロシア語音声コンテンツをテキストに変換
単語誤り率(WER)は0.7037
音声アシスタント
ロシア語音声コマンド認識
ロシア語音声アシスタントシステムでの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase