U

Unispeech 1350 En 90 It Ft 1h

microsoftによって開発
UniSpeechは、教師あり音素CTC学習と自己教師あり学習を組み合わせた統一音声表現学習モデルで、特にイタリア語向けにファインチューニングされています。
ダウンロード数 19
リリース時間 : 3/2/2022

モデル概要

このモデルは16kHzサンプリングの音声オーディオと音素ラベルで事前学習され、1時間のイタリア語音素データでファインチューニングされており、音素分類タスクに適しています。

モデル特徴

マルチタスク学習
教師あり音素CTC学習と音素認識対照自己教師あり学習を同時に実施
言語横断的汎化
生成された表現は音素構造に関連する情報をより良く捉え、言語間・領域間の汎化能力を向上
効率的なファインチューニング
わずか1時間のイタリア語音素データでファインチューニング可能

モデル能力

音声認識
音素分類
言語横断的音声表現学習

使用事例

音声認識
イタリア語音素認識
イタリア語音声を音素系列に変換
音素誤り率6.69%
音声技術研究
言語横断的音声表現研究
異なる言語間での音声表現の転移能力を研究
自己教師あり事前学習と教師あり転移学習と比較して、それぞれ最大13.4%と17.8%の相対音素誤り率低減を達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase