U

Unispeech 1350 En 17h Ky Ft 1h

microsoftによって開発
マイクロソフトUniSpeechアーキテクチャに基づく音声認識モデルで、キルギス語向けに特別にファインチューニングされています
ダウンロード数 39
リリース時間 : 3/2/2022

モデル概要

このモデルは16kHzサンプリング音声と音素ラベルで事前学習された大規模モデルで、1時間のキルギス語音素データでファインチューニングされています。主にキルギス語の自動音声認識タスクに使用されます。

モデル特徴

マルチタスク学習
教師あり音素CTC学習と音素認識対照自己教師あり学習を組み合わせています
言語間汎化能力
統一された事前学習方法により、言語間およびドメイン間の汎化能力を向上させます
効率的なファインチューニング
わずか1時間のキルギス語音素データでファインチューニングが可能です

モデル能力

キルギス語音声認識
音素シーケンス予測
言語間音声表現学習

使用事例

音声認識
キルギス語音声からテキストへ
キルギス語音声を音素シーケンスまたはテキストに変換します
自己教師あり事前学習と教師あり転移学習と比較して、最大13.4%および17.8%の相対音素エラー率の低減が可能です
音声技術研究
言語間音声表現研究
音声表現の言語間転移能力を研究するために使用されます
ドメイン転移音声認識タスクで6%の相対単語エラー率の低下を実現しました
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase