W

Wav2vec2 Large Xlsr 53 Breton

mrm8488によって開発
facebook/wav2vec2-large-xlsr-53をブルトン語でファインチューニングした音声認識モデル
ダウンロード数 26
リリース時間 : 3/2/2022

モデル概要

これはブルトン語に最適化された自動音声認識(ASR)モデルで、Facebookのwav2vec2-large-xlsr-53アーキテクチャを基に、Common Voiceデータセットを使用してトレーニングされました。

モデル特徴

多言語事前学習ベース
Facebookの多言語XLSR-53モデルをファインチューニングしており、強力な言語横断学習能力を有する
ブルトン語最適化
ブルトン語に特化して最適化され、その音声特性に適応している
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力をサポートし、一般的な音声アプリケーションに適している

モデル能力

音声認識
ブルトン語音声からテキストへ
自動音声転写

使用事例

音声転写
ブルトン語音声転写
ブルトン語の音声内容をテキストに変換
Common VoiceテストセットでWER46.49%
音声アシスタント
ブルトン語音声コマンド認識
ブルトン語音声アシスタントやデバイス制御に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase