W

Wav2vec2 Xls R 300m Hebrew

imvladikonによって開発
これはfacebook/wav2vec2-xls-r-300mモデルをファインチューニングしたヘブライ語自動音声認識モデルで、2段階のトレーニングにより小規模と大規模のデータセットで性能を最適化しています。
ダウンロード数 1.2M
リリース時間 : 3/2/2022

モデル概要

このモデルはヘブライ語の自動音声認識タスク専用に設計されており、小規模な高品質データセットと大規模な多様なデータセットで2段階のファインチューニングプロセスを経て、認識精度を向上させています。

モデル特徴

2段階ファインチューニング
最初に小規模な高品質データセットでファインチューニングし、その後大規模で多様なデータセットで二次トレーニングを行い、モデルの頑健性を向上させます
マルチソースデータ学習
トレーニングデータには高品質なアノテーションデータ、多様なソースのデータ、およびモデルによって弱ラベル付けされた未ラベルデータが含まれています
低単語誤り率
小規模テストセットで17.73%、大規模テストセットで23.18%の単語誤り率を達成しています

モデル能力

ヘブライ語音声認識
音声からテキストへの変換
頑健な音声処理

使用事例

音声文字起こし
ヘブライ語会議議事録
ヘブライ語の会議録音を自動的にテキストに変換
単語誤り率約23.18%
ヘブライ語音声アシスタント
ヘブライ語音声アシスタントに音声認識機能を提供
音声分析
ヘブライ語音声コンテンツ分析
ヘブライ語音声コンテンツを分析し、キー情報を抽出
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase