W

Wav2vec2 Xls R 300m Korean Lm

w11woによって開発
XLS-Rアーキテクチャに基づく韓国語自動音声認識モデルで、Zeroth韓国語データセットで微調整され、5-gram言語モデルが追加されています
ダウンロード数 23
リリース時間 : 3/2/2022

モデル概要

このモデルは韓国語自動音声認識(ASR)のための深層学習モデルで、FacebookのWav2Vec2-XLS-R-300Mアーキテクチャを微調整しており、韓国語音声からテキストへの変換タスクに適しています。

モデル特徴

韓国語最適化
韓国語音声認識に特化して微調整されており、Zeroth韓国語データセットで良好な性能を発揮します
5-gram言語モデル強化
Open Subtitles韓国語サブセットで訓練された5-gram言語モデルを追加し、認識精度を向上させています
ロバスト性テスト
HuggingFaceが主催するロバスト音声チャレンジに参加し、様々な条件下で性能をテストしました

モデル能力

韓国語音声認識
音声からテキストへの変換
5-gram言語モデルデコードをサポート

使用事例

音声文字起こし
韓国語音声文字起こし
韓国語音声コンテンツをテキストに変換します
Zeroth韓国語データセットで30.94% WERと7.97% CERを達成
音声アシスタント
韓国語音声コマンド認識
韓国語音声コマンドを認識し理解します
ロバスト音声イベントテストデータで66.47% WERを達成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase