W

Whisper Large V3 Turbo Common Voice 19 0 Zh TW

Developed by JacobLinCool
OpenAI Whisper-large-v3-turboをファインチューニングした繁体字中国語(台湾)自動音声認識モデル
Downloads 220
Release Time : 10/31/2024

Model Overview

これは繁体字中国語(台湾)向けに最適化された自動音声認識モデルで、Common Voice 19.0台湾中国語データセットでファインチューニングされており、プロンプト不要の音声テキスト変換タスクをサポートします。

Model Features

繁体字中国語最適化
台湾地域の繁体字中国語音声に特化して最適化訓練を実施
大規模データセット
標準Common Voiceデータセットより4倍大きいトレーニングデータを使用(約50kサンプル)
プロンプト不要
追加プロンプトなしで直接使用可能なASRモデルとして設計
Whisper能力継承
元のWhisperモデルの言語認識能力と複数中国語バリアント対応能力を保持

Model Capabilities

自動音声認識
繁体字中国語音声転写
音声テキスト変換

Use Cases

音声転写
会議議事録
台湾地域の中国語会議録音を自動的に文字記録に変換
単語誤り率32.56%、文字誤り率8.60%
音声メモ
日常の音声メモを検索可能なテキスト内容に変換
アクセシビリティ応用
リアルタイム字幕生成
台湾地域の動画コンテンツ向けにリアルタイム中国語字幕を生成
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase