X

Xls R Kyrgiz Cv8

Developed by lucio
このモデルはfacebook/wav2vec2-xls-r-300mをCommon Voice 8.0キルギス語データセットでファインチューニングした自動音声認識モデルです
Downloads 16
Release Time : 3/2/2022

Model Overview

キルギス語に最適化された音声認識モデルで、音声からテキストへの変換タスクに適しています

Model Features

低単語誤り率
テストセットで19.01%のWER(言語モデル使用時)を達成
多様なシナリオ対応
低品質音声シナリオに最適化され、様々な実用アプリケーションに適用可能
段階的学習
段階的な学習率スケジューリング戦略を採用し、トレーニング効果を最適化

Model Capabilities

キルギス語音声認識
音声からテキストへの変換
音声コンテンツインデックス作成

Use Cases

メディア処理
動画字幕生成
キルギス語動画コンテンツの字幕草案を自動生成
WER 19.01%(言語モデル使用時)
放送コンテンツインデックス作成
録音されたキルギス語放送番組のコンテンツインデックス作成
CER 5.38%(言語モデル使用時)
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase