W

Wav2vec2 Large Xlsr Thai Demo

sakaresによって開発
facebook/wav2vec2-large-xlsr-53をタイ語汎用音声データセットでファインチューニングした音声認識モデル
ダウンロード数 609
リリース時間 : 3/2/2022

モデル概要

これはタイ語音声認識専用のモデルで、XLSR-53アーキテクチャを基にファインチューニングされており、16kHzサンプリングレートの音声入力をサポートします。

モデル特徴

タイ語最適化
タイ語音声に特化してファインチューニングされており、タイ語認識精度が向上しています
XLSR-53ベース
強力なクロスランゲージ音声表現ベースモデルを利用してファインチューニングされています
16kHzサポート
16kHzサンプリングレートの音声入力をサポートしています

モデル能力

タイ語音声認識
音声からテキストへの変換

使用事例

音声書き起こし
タイ語音声からテキストへ
タイ語音声コンテンツを文字に変換します
汎用音声タイ語テストセットでWERが44.46%
音声アシスタント
タイ語音声コマンド認識
タイ語音声アシスタントのコマンド認識に使用されます
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase