W

Whisper Small Vi

namphungdn134によって開発
openai/whisper-smallをベースにベトナム語音声データ向けにファインチューニングした自動音声認識モデルで、ベトナム語の文字起こし精度と頑健性を向上
ダウンロード数 334
リリース時間 : 4/13/2025

モデル概要

ベトナム語に最適化された自動音声認識(ASR)モデルで、音声からテキストへの変換タスクに適しており、特にベトナム語のアクセントや方言に最適化

モデル特徴

ベトナム語最適化
ベトナム語の音声特性に特化してファインチューニングし、方言やアクセントの認識能力を向上
軽量モデル
Whisper小型アーキテクチャを基に、高い精度を維持しながら計算リソース要件を低減
高品質な文字起こし
テストセットで9.3485の単語誤り率(WER)を達成し、優れた性能を発揮

モデル能力

ベトナム語音声認識
音声からテキストへの変換
音声文字起こし

使用事例

音声文字起こし
会議議事録
ベトナム語の会議録音を自動的に文字起こし
90%以上の精度
メディア字幕生成
ベトナム語の動画コンテンツに自動的に字幕を生成
音声アシスタント
ベトナム語音声コマンド認識
ベトナム語のスマートホームやデバイス制御に使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase