W

Wav2vec2 Large Xlsr 53 Greek

vasilisによって開発
facebook/wav2vec2-large-xlsr-53モデルをベースに微調整されたギリシャ語音声認識モデルで、16kHzサンプリングレートの音声入力に対応しています。
ダウンロード数 25
リリース時間 : 3/2/2022

モデル概要

このモデルはギリシャ語に最適化された自動音声認識(ASR)モデルで、Wav2Vec2アーキテクチャに基づき、一般音声とCSS10ギリシャ語単話者データセットを使用して微調整されています。

モデル特徴

複数データセット微調整
一般音声とCSS10ギリシャ語単話者データセットを組み合わせて訓練し、モデルの認識精度を向上させます。
テキスト標準化処理
ギリシャ語の特殊文字を標準化処理し、例えばςをσに変換して認識効果を向上させます。
言語モデル不要
追加の言語モデルのサポートなしで直接音声認識に使用できます。

モデル能力

ギリシャ語音声認識
16kHzオーディオ処理
リアルタイム音声文字変換

使用事例

音声書き起こし
ギリシャ語会議記録
ギリシャ語の会議録音を自動的に文字に書き起こします。
単語誤り率18.99%、文字誤り率5.78%
音声アシスタント
ギリシャ語音声アシスタントアプリの音声認識モジュールに使用します。
教育
言語学習アプリ
学習者がギリシャ語の発音と聴力を練習するのを支援します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase