W

Wav2vec2 Large Xlsr Ia

gchhablaniによって開発
これはFacebookのwav2vec2-large-xlsr-53モデルを国際語(Interlingua)で微調整した自動音声認識(ASR)モデルで、汎用音声(Common Voice)データセットを使用して訓練されています。
ダウンロード数 367
リリース時間 : 3/2/2022

モデル概要

このモデルは国際語の自動音声認識タスクに使用され、音声入力をテキスト出力に変換することができます。

モデル特徴

多言語対応
XLSR-53モデルに基づき、言語を超えた学習能力を持つ
高精度認識
国際語テストセットで25.09%の単語誤り率(WER)を達成しました。
使いやすさ
簡単なAPIインターフェースを提供し、音声認識に直接使用できます。

モデル能力

音声認識
国際語音声をテキストに変換
16kHzオーディオ処理

使用事例

音声文字起こし
国際語音声文字起こし
国際語の音声内容をテキストに変換する
単語誤り率25.09%
音声アシスタント
国際語音声指令認識
国際語をサポートする音声アシスタントの構築に使用する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase