W

Whisper Base Vi

Developed by namphungdn134
openai/whisper-baseモデルを100時間のベトナム語音声データでファインチューニングした音声認識モデルで、ベトナム語文字起こしの精度を向上
Downloads 215
Release Time : 3/16/2025

Model Overview

ベトナム語に最適化された自動音声認識(ASR)モデルで、音声からテキストへの変換タスクに適しています

Model Features

ベトナム語最適化
ベトナム語の特徴に特化してファインチューニングし、方言やアクセントの認識能力を向上
効率的な推論
Whisperベースアーキテクチャにより、高速な推論速度を維持
実シーン適応
多様な音声データで訓練され、実際のアプリケーションでの頑健性を強化

Model Capabilities

ベトナム語音声認識
音声からテキスト変換
音声文字起こし

Use Cases

音声文字起こし
会議議事録
ベトナム語会議録音を自動で文字記録に変換
単語誤り率16.9148%
メディア字幕生成
ベトナム語動画コンテンツに自動で字幕を生成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase