W

Wav2vec2 Large Xlsr Kyrgyz

iarfmooseによって開発
これはfacebook/wav2vec2-large-xlsr-53モデルを基に、キルギス語のユニバーサル音声データセットでファインチューニングされた自動音声認識モデルです。
ダウンロード数 22
リリース時間 : 3/2/2022

モデル概要

このモデルはキルギス語の自動音声認識タスク専用で、16kHzサンプリングレートの音声入力をサポートしています。

モデル特徴

多言語事前学習ベース
facebook/wav2vec2-large-xlsr-53モデルを基にファインチューニングされており、このモデルは複数の言語で事前学習済みです
特定言語最適化
キルギス語に特化して最適化されており、この言語の認識精度が向上しています
軽量デプロイ
追加の言語モデルサポートなしで直接使用可能

モデル能力

キルギス語音声認識
16kHzオーディオ処理

使用事例

音声からテキストへ
キルギス語音声文字起こし
キルギス語音声をテキストに変換
テストWERは34.71%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase