W

Wav2vec2 Xls R 300m Hy AM CV8 V1

emreによって開発
facebook/wav2vec2-xls-r-300mを基に汎用音声データセットでファインチューニングした音声認識モデル
ダウンロード数 17
リリース時間 : 3/2/2022

モデル概要

このモデルはwav2vec2-xls-r-300mのファインチューン版で、音声認識タスクに特化しており、汎用音声データセットで訓練されています。

モデル特徴

wav2vec2-xls-rアーキテクチャ採用
facebookのwav2vec2-xls-r-300mをベースモデルとして使用し、強力な音声特徴抽出能力を備えています
汎用音声データセットでファインチューニング
汎用音声データセットでファインチューニングを行い、モデルの汎化能力を向上させました
低い単語誤り率
評価データセットで0.9598の単語誤り率(WER)を達成しました

モデル能力

音声認識
音声からテキストへの変換

使用事例

音声文字起こし
会議議事録の自動転記
会議録音を自動的に文字記録に変換
単語誤り率0.9598
音声アシスタント
音声アシスタントのバックエンド認識エンジンとして
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase