W

Whisper Small Cantonese

alvanliiによって開発
OpenAI Whisper-smallをファインチューニングした広東語音声認識モデル、Common Voice 16.0テストセットでCER7.93を達成
ダウンロード数 2,413
リリース時間 : 12/8/2022

モデル概要

広東語に最適化された自動音声認識モデル、効率的で正確な広東語音声から文字への変換をサポート

モデル特徴

最適化された広東語認識
広東語の特徴に特化してファインチューニング、文字誤り率(CER)は7.93まで低減
効率的な推論
Flash Attentionによる高速化をサポート、1サンプル処理にわずか0.055秒
多フォーマット対応
GGMLとCT2フォーマットを提供、Whisper.cppやWhisperXなどのツールと互換性あり
推測的デコード対応
補助モデルとして大規模モデルの推論プロセスを加速可能

モデル能力

広東語音声認識
中国語音声認識
高速音声文字変換
長音声処理(チャンク分割対応)

使用事例

音声文字起こし
広東語動画字幕生成
広東語動画コンテンツに自動的に正確な字幕を生成
CER7.93の認識精度
音声アシスタント
広東語対応の音声インタラクションアプリケーション構築
高速応答(0.055秒/サンプル)
音声分析
広東語音声データ分析
広東語音声コンテンツの書き起こしと分析
複数の広東語データセットフォーマットに対応
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase