U

Unispeech 1350 En 90 It Ft 1h

Developed by microsoft
UniSpeechは、教師あり音素CTC学習と自己教師あり学習を組み合わせた統一音声表現学習モデルで、特にイタリア語向けにファインチューニングされています。
Downloads 19
Release Time : 3/2/2022

Model Overview

このモデルは16kHzサンプリングの音声オーディオと音素ラベルで事前学習され、1時間のイタリア語音素データでファインチューニングされており、音素分類タスクに適しています。

Model Features

マルチタスク学習
教師あり音素CTC学習と音素認識対照自己教師あり学習を同時に実施
言語横断的汎化
生成された表現は音素構造に関連する情報をより良く捉え、言語間・領域間の汎化能力を向上
効率的なファインチューニング
わずか1時間のイタリア語音素データでファインチューニング可能

Model Capabilities

音声認識
音素分類
言語横断的音声表現学習

Use Cases

音声認識
イタリア語音素認識
イタリア語音声を音素系列に変換
音素誤り率6.69%
音声技術研究
言語横断的音声表現研究
異なる言語間での音声表現の転移能力を研究
自己教師あり事前学習と教師あり転移学習と比較して、それぞれ最大13.4%と17.8%の相対音素誤り率低減を達成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase