W

Whisper Large V3 Turbo Common Voice 19 0 Zh TW

JacobLinCoolによって開発
OpenAI Whisper-large-v3-turboをファインチューニングした繁体字中国語(台湾)自動音声認識モデル
ダウンロード数 220
リリース時間 : 10/31/2024

モデル概要

これは繁体字中国語(台湾)向けに最適化された自動音声認識モデルで、Common Voice 19.0台湾中国語データセットでファインチューニングされており、プロンプト不要の音声テキスト変換タスクをサポートします。

モデル特徴

繁体字中国語最適化
台湾地域の繁体字中国語音声に特化して最適化訓練を実施
大規模データセット
標準Common Voiceデータセットより4倍大きいトレーニングデータを使用(約50kサンプル)
プロンプト不要
追加プロンプトなしで直接使用可能なASRモデルとして設計
Whisper能力継承
元のWhisperモデルの言語認識能力と複数中国語バリアント対応能力を保持

モデル能力

自動音声認識
繁体字中国語音声転写
音声テキスト変換

使用事例

音声転写
会議議事録
台湾地域の中国語会議録音を自動的に文字記録に変換
単語誤り率32.56%、文字誤り率8.60%
音声メモ
日常の音声メモを検索可能なテキスト内容に変換
アクセシビリティ応用
リアルタイム字幕生成
台湾地域の動画コンテンツ向けにリアルタイム中国語字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase