W

Wav2vec2 Large Xlsr Breton

cahyaによって開発
facebook/wav2vec2-large-xlsr-53を基にブルトン語Common Voiceデータセットでファインチューニングした音声認識モデル
ダウンロード数 25
リリース時間 : 3/2/2022

モデル概要

このモデルはブルトン語に最適化された自動音声認識(ASR)モデルで、Wav2Vec2アーキテクチャを採用し、Common Voiceのブルトン語データセットでファインチューニングされています。

モデル特徴

ブルトン語最適化
ブルトン語に特化してファインチューニングされており、その言語特性に対応しています
XLSR大規模モデルベース
facebook/wav2vec2-large-xlsr-53事前学習モデルを基にしており、強力な音声特徴抽出能力を有しています
16kHzサンプリングレート対応
16kHzサンプリングレートの音声入力をサポートし、一般的な音声アプリケーションに適しています

モデル能力

ブルトン語音声認識
自動音声テキスト変換
音声内容分析

使用事例

音声文字起こし
ブルトン語音声からテキストへ
ブルトン語の音声内容をテキスト形式に変換します
テストWER 41.71%
音声アシスタント
ブルトン語音声インタラクション
ブルターニュ地域のユーザーに現地言語での音声インタラクション機能を提供します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase