V

Vi Whisper Large V3 Turbo V1

suziiによって開発
ベトナム語自動音声認識(ASR)タスク向けに最適化されたWhisper-V3-Turboモデル、複数のベトナム語データセットでファインチューニング済み
ダウンロード数 182
リリース時間 : 1/9/2025

モデル概要

Whisper-V3-Turboアーキテクチャに基づくベトナム語自動音声認識モデル、240時間のトレーニングでベトナム語認識性能を最適化

モデル特徴

ベトナム語最適化
ベトナム語音声認識に特化してファインチューニングを実施
マルチデータセットトレーニング
10種類の異なるベトナム語音声データセットを統合してトレーニング
効率的なトレーニング
Nvidia A6000 GPU1枚で240時間のトレーニングを完了

モデル能力

ベトナム語音声認識
音声テキスト変換
タイムスタンプ生成

使用事例

音声文字起こし
ベトナム語会議議事録
ベトナム語会議録音を文字記録に変換
音声コンテンツインデックス作成
ベトナム語音声コンテンツの検索可能なテキストインデックスを作成
支援技術
リアルタイム字幕生成
ベトナム語動画コンテンツ向けリアルタイム字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase