W

Wav2vec2 Xls R 300m Zh HK V2

w11woによって開発
XLS-Rアーキテクチャに基づく広東語自動音声認識モデル、Common Voice広東語データセットでファインチューニング
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

これは広東語(zh-HK)向けに最適化された自動音声認識モデルで、FacebookのWav2Vec2-XLS-R-300Mアーキテクチャを基にファインチューニングされており、広東語音声からテキストへの変換タスクに適しています。

モデル特徴

広東語最適化
広東語音声認識に特化して最適化されたトレーニング
大規模事前学習
300MパラメータのXLS-Rアーキテクチャを基に、強力な音声特徴抽出能力を有する
複数データセット検証
Common Voiceやロバスト音声コンペティションなど複数のデータセットで評価済み

モデル能力

広東語音声認識
音声からテキストへ
自動音声認識

使用事例

音声書き起こし
広東語音声転写
広東語音声内容を文字に変換
Common Voice 8テストセットでCERが23.02%
音声アシスタント
広東語音声コマンド認識
広東語音声アシスタントやスマートホームデバイスの音声コマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase