W

Wav2vec2 Large Xlsr 53 Hebrew

imvladikonによって開発
facebook/wav2vec2-large-xlsr-53をベースに、ヘブライ語音声データで微調整した自動音声認識モデル
ダウンロード数 338
リリース時間 : 3/2/2022

モデル概要

これはヘブライ語の自動音声認識(ASR)に使用するモデルで、XLSR - 53アーキテクチャを微調整して作成され、16kHzのサンプリングレートの音声入力をサポートします。

モデル特徴

多言語事前学習の基礎
XLSR - 53多言語事前学習モデルをベースにしており、強力な言語横断的な音声特徴抽出能力を持っています。
ヘブライ語最適化
ヘブライ語に特化して微調整され、この言語の認識性能が最適化されています。
言語モデル不要
追加の言語モデルのサポートなしで直接使用できます。

モデル能力

ヘブライ語音声認識
16kHzオーディオ処理
エンドツーエンドの音声からテキストへの変換

使用事例

音声文字起こし
ヘブライ語会議録
ヘブライ語の会議録音を自動的に文字起こしします。
音声ノートの変換
ヘブライ語の音声ノートを編集可能なテキストに変換します。
支援技術
音声制御アプリケーション
ヘブライ語のユーザーに音声制御インターフェースを提供します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase