W

Wav2vec2 Large Xlsr 53 Greek

lighteternalによって開発
これはXLSR-Wav2Vec2アーキテクチャに基づくギリシャ語自動音声認識モデルで、ギリシャ軍事学院とクレタ工科大学によって開発されました。
ダウンロード数 443
リリース時間 : 3/2/2022

モデル概要

このモデルは事前学習された自動音声認識(ASR)モデルで、特にギリシャ語向けに微調整されており、ギリシャ語音声をテキストに変換できます。

モデル特徴

言語間音声表現
XLSR-Wav2Vec2アーキテクチャに基づき、複数言語にわたって有用な音声表現を学習可能
高性能ギリシャ語認識
Common Voiceギリシャ語テストセットで10.5%の単語誤り率(WER)を達成
大規模トレーニングデータ
Common VoiceとCSS10データセットの約1.5GBのギリシャ語データを使用してトレーニング

モデル能力

ギリシャ語音声認識
音声からテキストへの変換
16kHzサンプリングレートの音声処理をサポート

使用事例

音声文字起こし
ギリシャ語音声からテキストへ
ギリシャ語音声コンテンツを編集可能なテキストに変換
単語誤り率10.5%、文字誤り率2.87%
音声アシスタント
ギリシャ語音声コマンド認識
ギリシャ語音声アシスタントやスマートホームデバイスの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase