W

Wav2vec2 Large Xlsr Georgian

m3hrdadfiによって開発
これはfacebook/wav2vec2-large-xlsr-53モデルを基にジョージア語でファインチューニングした自動音声認識(ASR)モデルで、Common Voiceデータセットを使用してトレーニングされました。
ダウンロード数 66
リリース時間 : 3/2/2022

モデル概要

このモデルはジョージア語の音声認識タスクに特化しており、ジョージア語音声をテキストに変換できます。

モデル特徴

ジョージア語専用
ジョージア語に最適化された音声認識モデル
XLSR大規模モデルベース
facebookのwav2vec2-large-xlsr-53モデルをファインチューニング
Common Voiceデータセットでトレーニング
Common Voiceジョージア語データセットを使用してトレーニング

モデル能力

ジョージア語音声認識
音声テキスト変換

使用事例

音声文字起こし
音声コンテンツ文字起こし
ジョージア語音声コンテンツをテキストに変換
43.86% WER(単語誤り率)
音声アシスタント
ジョージア語音声コマンド認識
ジョージア語音声アシスタントや音声制御システムの音声認識コンポーネントとして使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase