W

Wav2vec2 Xls R 300m Khmer

vitouphyによって開発
これはOpenSLRデータセットでファインチューニングされたfacebook/wav2vec2-xls-r-300mモデルで、クメール語(km)の自動音声認識タスク専用に設計されています。
ダウンロード数 2,321
リリース時間 : 3/2/2022

モデル概要

このモデルはクメール語の自動音声認識システムで、限られたデータセット(約4時間)でトレーニングされ、良好な認識能力を示しています。

モデル特徴

少量データでの効率的なトレーニング
約4時間のトレーニングデータ(実際のトレーニング時間3.2時間)のみを使用して良好な認識効果を達成しました
言語モデルサポート
言語モデル(kenlm)との組み合わせによるデコードをサポートし、認識精度を大幅に向上させます
軽量なデプロイ
3億パラメータのモデルに基づいており、比較的軽量で実際のアプリケーション展開に適しています

モデル能力

クメール語音声認識
音声からテキストへの変換
音声内容分析

使用事例

音声文字起こし
クメール語音声からテキストへ
クメール語の音声内容をテキスト記録に変換します
WER 25.7%, CER 7.03%
音声分析
クメール語音声内容分析
クメール語音声のキーワードと内容を分析します
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase