W

Wav2vec2 Xls R 300m Korean

w11woによって開発
XLS-Rアーキテクチャに基づく韓国語自動音声認識モデル、Zeroth Koreanデータセットでファインチューニング済み
ダウンロード数 152
リリース時間 : 3/2/2022

モデル概要

このモデルはXLS-Rアーキテクチャに基づく自動音声認識モデルで、韓国語に特化して最適化されており、音声からテキストへの変換タスクに適しています。

モデル特徴

韓国語最適化
韓国語音声認識に特化してファインチューニングされており、韓国語データセットで良好な性能を発揮します。
XLS-Rアーキテクチャ
先進的なXLS-Rアーキテクチャに基づいており、強力な音声特徴抽出能力を備えています。
複数データセット検証
Zeroth Koreanやロバスト音声コンペティションデータを含む複数の韓国語データセットで評価されています。

モデル能力

韓国語音声認識
音声からテキストへの変換
自動音声認識

使用事例

音声書き起こし
韓国語音声からテキストへ
韓国語音声コンテンツをテキストに変換
Zeroth KoreanデータセットでWER 29.54%、CER 9.53%
音声認識チャレンジ
ロバスト音声コンペティション
HuggingFaceが主催するロバスト音声認識チャレンジに参加
開発データでWER 76.26%、CER 38.67%
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase