W

Wav2vec2 Xlsr Georgian

sammy786によって開発
このモデルはfacebook/wav2vec2-xls-r-1bをジョージア語データセットでファインチューニングした自動音声認識モデルです
ダウンロード数 19
リリース時間 : 3/2/2022

モデル概要

wav2vec2-xls-r-1bアーキテクチャに基づくジョージア語自動音声認識モデルで、Common Voice 8データセットでファインチューニングされています

モデル特徴

高性能音声認識
Common Voice 8ジョージア語テストセットで23.9%の単語誤り率(WER)を達成
大規模事前学習
10億パラメータのwav2vec2-xls-r-1bモデルをベースにファインチューニング
マルチシナリオ適応
会話やロバスト音声イベントデータセットで評価済み

モデル能力

ジョージア語音声テキスト変換
自動音声認識
会話音声処理

使用事例

音声書き起こし
ジョージア語音声文字起こし
ジョージア語音声をテキストに変換
Common VoiceテストセットでWER 23.9%
対話システム
ジョージア語対話処理
ジョージア語会話音声を処理
ロバスト音声イベントテストセットでWER 74.41%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase