W

Wav2vec2 Large Xlsr 53 Greek

jonatasgrosmanによって開発
これはギリシャ語音声認識タスクに対して微調整されたXLSR - 53大規模モデルで、facebook/wav2vec2-large-xlsr-53モデルをベースに、Common Voice 6.1とCSS10データセットを使用して訓練されました。
ダウンロード数 130.81k
リリース時間 : 3/2/2022

モデル概要

このモデルは専門的にギリシャ語自動音声認識(ASR)に使用され、ギリシャ語の音声をテキストに変換することができます。

モデル特徴

高性能ギリシャ語認識
Common Voiceギリシャ語テストセットで11.62%の単語誤り率(WER)と3.36%の文字誤り率(CER)を達成しました。
XLSR - 53大規模モデルをベースとする
facebook/wav2vec2-large-xlsr-53モデルを微調整しており、強力な音声特徴抽出能力を持っています。
複数のデータセットでの訓練
Common Voice 6.1とCSS10データセットを使用して訓練され、多様な音声シーンをカバーしています。

モデル能力

ギリシャ語音声認識
16kHzオーディオ処理
言語モデルなしで直接使用可能

使用事例

音声からテキストへの変換
ギリシャ語音声の文字起こし
ギリシャ語の音声内容をテキストに変換します。
正確率が88.38%(1 - WER)に達しました。
音声アシスタント
ギリシャ語音声指令の認識
ギリシャ語の音声アシスタントまたは制御システムの指令認識に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase