P

Phowhisper Medium

Developed by vinai
PhoWhisperは、ベトナム語の自動音声認識(ASR)に特化したモデルシリーズで、844時間のベトナム語アクセントデータセットでWhisperモデルを微調整することで高いロバスト性を実現しています。
Downloads 2,999
Release Time : 2/18/2024

Model Overview

PhoWhisperは5つのバージョンを提供し、ベトナム語の自動音声認識タスクに特化しており、ベトナム語ASRベンチマークデータセットで現在最高の性能を達成しています。

Model Features

多様なアクセントへの適応
844時間の様々なベトナム語アクセントを含むデータセットで訓練されており、強力なアクセントロバスト性を備えています。
最高の性能
ベトナム語ASRベンチマークデータセットで現在最高の性能を達成しています。
複数のバージョンから選択
さまざまなニーズに対応するために、5つの異なるバージョンのモデルを提供しています。

Model Capabilities

ベトナム語音声認識
多様なアクセントの音声処理

Use Cases

音声文字起こし
ベトナム語会議の記録
ベトナム語の会議録音を自動的に文字起こしします。
高い精度の文字起こし結果
メディアの字幕生成
ベトナム語のビデオコンテンツに自動的に字幕を生成します。
多様なベトナム語アクセントに対応した字幕生成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase