W

Wav2vec2 Large Xlsr 53 Turkish

ceydaによって開発
これは、Facebookのwav2vec2-large-xlsr-53モデルをトルコ語のCommon Voiceデータセットで微調整した自動音声認識(ASR)モデルです。
ダウンロード数 54
リリース時間 : 3/2/2022

モデル概要

このモデルは、トルコ語の音声認識タスクに特化しており、トルコ語の音声をテキストに変換することができます。

モデル特徴

高精度のトルコ語認識
Common Voiceトルコ語テストセットで27.59%のWER(単語誤り率)を達成しました。
XLSR大規模モデルに基づく
Facebookのwav2vec2-large-xlsr-53モデルを微調整しており、強力な音声特徴抽出能力を持っています。
16kHzサンプリングレートのサポート
16kHzサンプリングレートの音声入力をサポートしており、ほとんどの音声アプリケーションシナリオに適しています。

モデル能力

トルコ語音声認識
音声からテキストへの変換
自動音声文字起こし

使用事例

音声文字起こし
トルコ語音声を文字に変換
トルコ語の音声内容を編集可能なテキスト形式に変換します。
単語誤り率27.59%
音声アシスタント
トルコ語音声コマンド認識
トルコ語の音声アシスタントや音声制御アプリケーションの開発に使用します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase