X

Xtreme S Xlsr 300m Voxpopuli En

anton-lによって開発
このモデルは、facebook/wav2vec2-xls-r-300mをGOOGLE/XTREME_S - VOXPOPULI.ENデータセットでファインチューニングした音声認識モデルで、英語音声からテキストへの変換タスクをサポートします。
ダウンロード数 28
リリース時間 : 4/29/2022

モデル概要

これは英語音声認識タスク向けに最適化されたモデルで、VOXPOPULI.ENデータセットでファインチューニングされており、英語音声をテキストに変換できます。

モデル特徴

高効率音声認識
VOXPOPULI.ENデータセットでファインチューニングされ、英語音声認識向けに最適化されています
wav2vec2-xls-rアーキテクチャベース
facebookのwav2vec2-xls-r-300m事前学習モデルをベースに採用
マルチGPUトレーニング最適化
マルチGPU分散トレーニングをサポートし、トレーニング効率を向上

モデル能力

英語音声認識
音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
会議議事録自動文字起こし
英語会議録音を自動的に文字記録に変換
文字誤り率(Cer): 0.0966、単語誤り率(Wer): 0.1549
ポッドキャストコンテンツ文字起こし
英語ポッドキャストコンテンツを自動的に原稿に変換
支援技術
リアルタイム字幕生成
英語動画コンテンツ向けにリアルタイム字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase