W

Wav2vec2 Large Xls R 300m Turkish Colab

izzy-lazersonによって開発
これはfacebook/wav2vec2-xls-r-300mモデルをcommon_voiceトルコ語データセットで微調整した音声認識モデルです。
ダウンロード数 34
リリース時間 : 3/2/2022

モデル概要

このモデルはトルコ語の自動音声認識(ASR)タスクに特化しており、common_voice評価セットで0.3363の単語誤り率を達成しました。

モデル特徴

トルコ語最適化
トルコ語に特化して微調整されており、common_voiceトルコ語データセットで良好な性能を発揮します。
XLS - Rアーキテクチャに基づく
facebookのwav2vec2-xls-r-300m事前学習モデルをベースにしており、強力な音声特徴抽出能力を持っています。
低い単語誤り率
評価セットで0.3363の単語誤り率を達成し、優れた性能を示しました。

モデル能力

トルコ語音声認識
音声をテキストに変換
音声内容理解

使用事例

音声文字起こし
トルコ語音声の文字起こし
トルコ語の音声内容をテキストに変換します。
単語誤り率0.3363
音声アシスタント
トルコ語音声指令認識
トルコ語の音声アシスタントまたはスマートホーム機器の音声指令認識に使用されます。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase