W

Wav2vec2 Xlsr Multilingual 56

voidfulによって開発
これは56言語をサポートする多言語自動音声認識(ASR)モデルで、facebook/wav2vec2-large-xlsr-53を汎用音声データセットで微調整して作成されました。
ダウンロード数 21.69k
リリース時間 : 3/2/2022

モデル概要

このモデルは多言語自動音声認識タスクに使用され、アラビア語、中国語、英語、フランス語などを含む56言語をサポートします。

モデル特徴

多言語対応
56言語の音声認識をサポートし、幅広い言語ニーズをカバーします
XLSRアーキテクチャに基づく
facebook/wav2vec2-large-xlsr-53モデルを微調整したもので、強力な音声認識能力を持ちます
汎用音声データセット
汎用音声(Common Voice)データセットを使用してトレーニングされ、データソースが広範囲です

モデル能力

自動音声認識
多言語音声をテキストに変換
音声コンテンツ分析

使用事例

音声書き起こし
多言語会議記録
多言語会議録音を自動的にテキストに書き起こします
56言語の音声書き起こしをサポートします
音声アシスタント
多言語音声アシスタントに音声認識機能を提供します
音声分析
音声コンテンツ分析
音声コンテンツのキーワードとトピックを分析します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase