W

Whisper Th Medium Combined

biodatlabによって開発
openai/whisper-mediumをベースに、拡張版のタイ語データセットで微調整し、タイ語の自動音声認識に使用する。
ダウンロード数 4,167
リリース時間 : 12/14/2022

モデル概要

このモデルは、openai/whisper-mediumをベースに、拡張版のmozilla-foundation/common_voice_13_0タイ語データセット、google/fleursデータセット、および選りすぐりのデータセットで微調整したタイ語自動音声認識モデルです。

モデル特徴

高精度タイ語認識
common-voice-13テストセットで7.42の文字誤り率(WER)を達成しました。
複数データセットの微調整
mozilla-foundation/common_voice_13_0、google/fleurs、および選りすぐりのデータセットに基づいて微調整します。
長い音声の処理をサポート
chunk_length_s=30の長い音声の分割処理をサポートします。

モデル能力

タイ語音声認識
長い音声のトランスクリプション

使用事例

音声トランスクリプション
タイ語音声を文字に変換
タイ語の音声ファイルを文字に変換します。
文字誤り率7.42
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase