W

Wav2vec2 Large Xlsr 53 Th

airesearchによって開発
これはwav2vec2-large-xlsr-53モデルをベースに、タイ語Common Voice 7.0データセットでファインチューニングした自動音声認識(ASR)モデルです。
ダウンロード数 110.74k
リリース時間 : 3/2/2022

モデル概要

このモデルはタイ語音声認識タスク専用に設計され、Common Voice 7.0タイ語データセットでファインチューニングされており、複数のタイ語トークナイザーをサポートしています。

モデル特徴

複数トークナイザー対応
PyThaiNLPやdeepcutなど複数のタイ語トークナイザーを統合し、認識精度を向上
高性能
Common Voice 7.0テストセットで低いWER(0.9524%)とCER(0.1623%)を達成
データクリーニング最適化
特別に設計されたクリーニングルールでデータセットを前処理し、モデルトレーニング効果を向上

モデル能力

タイ語音声認識
音声からテキストへの変換
複数のタイ語トークン化方式をサポート

使用事例

音声文字起こし
タイ語音声からテキストへ
タイ語音声コンテンツをテキスト形式に変換
テストセットでWER 0.9524%を達成
音声アシスタント
タイ語音声コマンド認識
タイ語音声アシスタントやスマートデバイスのコマンド認識に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase