R

Romanian Wav2vec2

gigantによって開発
facebook/wav2vec2-xls-r-300mをファインチューニングしたルーマニア語音声認識モデルで、Common Voice 8.0とルーマニア語音声合成データセットで訓練され、HuggingFace Robust Speech Challengeでルーマニア語音声認識1位を獲得しました。
ダウンロード数 88.90k
リリース時間 : 3/2/2022

モデル概要

このモデルは16kHzでサンプリングされた音声クリップからルーマニア語を認識し、小文字で句読点を含まないテキストを予測します。

モデル特徴

高性能ルーマニア語認識
Common Voice 8.0テストセットでWER 11.73(CER 2.93)の優れた性能を達成
言語モデル強化
5-gram言語モデルを統合し、認識精度を大幅に向上(WERが46.99から38.63に改善)
複数データセット訓練
Common Voice 8.0とルーマニア語音声合成データセットを組み合わせて訓練
コンペ優勝モデル
HuggingFace Robust Speech Challengeでルーマニア語音声認識1位を獲得

モデル能力

ルーマニア語音声認識
16kHz音声処理
句読点なしテキスト出力

使用事例

音声テキスト変換
ルーマニア語音声文字起こし
ルーマニア語音声をテキストに変換
Common Voice 8.0テストセットでWER 11.73
音声アシスタント
ルーマニア語音声コマンド認識
ルーマニア語音声アシスタントのフロントエンド音声認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase