W

Whisper Large V3 Cantonese

khleelooによって開発
Whisper v3を微調整した広東語自動音声認識モデル、Common Voice 17データセットで訓練
ダウンロード数 25
リリース時間 : 12/4/2024

モデル概要

このモデルはWhisper v3モデルを微調整したバージョンで、広東語(Yue)の自動音声認識(ASR)タスクに特化して訓練されています。音声アシスタント、文字起こしサービスなどのアプリケーションに適しています。

モデル特徴

広東語音声認識
広東語に最適化された音声認識能力
Whisper v3アーキテクチャ
OpenAIの強力なWhisper v3モデルアーキテクチャを基に構築
効率的な微調整
Common Voice 17データセットで10エポックの微調整を実施

モデル能力

広東語音声からテキストへの変換
自動音声認識
音声文字起こし

使用事例

音声アシスタント
広東語音声アシスタント
広東語ユーザー向けの音声インタラクション機能を提供
文字起こしサービス
広東語音声文字起こし
広東語音声コンテンツをテキストに変換
アクセシビリティ機能
広東語アクセシビリティサービス
広東語使用者向けの音声からテキストへのアクセシビリティ機能を提供
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase