W

Wav2vec2 Large Xlsr Turkish Artificial Cv

cahyaによって開発
これはXLSR Wav2Vec2アーキテクチャに基づくトルコ語自動音声認識モデルで、Common Voiceのトルコ語データセットでファインチューニングされています。
ダウンロード数 26
リリース時間 : 3/2/2022

モデル概要

このモデルはトルコ語の自動音声認識タスクに使用され、トルコ語音声をテキストに変換できます。

モデル特徴

高精度トルコ語認識
Common Voiceトルコ語テストセットで14.61%のWER(単語誤り率)を達成
XLSR事前学習モデルベース
大規模多言語事前学習モデルを活用したファインチューニングで、強力な音声特徴抽出能力を有する
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力を処理可能

モデル能力

トルコ語音声認識
音声テキスト変換

使用事例

音声文字起こし
トルコ語音声文字起こし
トルコ語音声コンテンツをテキストに変換
Common Voiceテストセットで単語誤り率14.61%
音声アシスタント
トルコ語音声コマンド認識
トルコ語音声アシスタントやスマートホームデバイスのコマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase