W

Wav2vec2 Xls R 300m Ar

nouamanetaziによって開発
このモデルはfacebook/wav2vec2-xls-r-300mをCommon Voiceアラビア語データセットでファインチューニングした自動音声認識モデルです。
ダウンロード数 19
リリース時間 : 3/2/2022

モデル概要

これはアラビア語に最適化された自動音声認識モデルで、XLS-R-300Mアーキテクチャを基にファインチューニングされており、アラビア語音声からテキストへの変換タスクに適しています。

モデル特徴

アラビア語最適化
アラビア語音声に特化してファインチューニングされており、アラビア語音声の認識精度が向上しています。
XLS-Rアーキテクチャ採用
FacebookのXLS-R-300M事前学習モデルを基盤としており、強力な音声特徴抽出能力を有しています。
Common Voiceデータセットで訓練
Common Voiceアラビア語データセットを使用して訓練されており、多様な音声シナリオをカバーしています。

モデル能力

アラビア語音声認識
音声からテキストへの変換
長い音声処理(チャンク処理対応)

使用事例

音声文字起こし
アラビア語音声文字起こし
アラビア語音声コンテンツをテキストに変換
音声アシスタント
アラビア語音声コマンド認識
アラビア語音声アシスタントや制御システムの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase