W

Wav2vec2 Large Xlsr Thai Demo

Developed by sakares
facebook/wav2vec2-large-xlsr-53をタイ語汎用音声データセットでファインチューニングした音声認識モデル
Downloads 609
Release Time : 3/2/2022

Model Overview

これはタイ語音声認識専用のモデルで、XLSR-53アーキテクチャを基にファインチューニングされており、16kHzサンプリングレートの音声入力をサポートします。

Model Features

タイ語最適化
タイ語音声に特化してファインチューニングされており、タイ語認識精度が向上しています
XLSR-53ベース
強力なクロスランゲージ音声表現ベースモデルを利用してファインチューニングされています
16kHzサポート
16kHzサンプリングレートの音声入力をサポートしています

Model Capabilities

タイ語音声認識
音声からテキストへの変換

Use Cases

音声書き起こし
タイ語音声からテキストへ
タイ語音声コンテンツを文字に変換します
汎用音声タイ語テストセットでWERが44.46%
音声アシスタント
タイ語音声コマンド認識
タイ語音声アシスタントのコマンド認識に使用されます
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase