Whisper Large V3 Turbo Common Voice 19 0 Zh TW
OpenAI Whisper-large-v3-turboをファインチューニングした繁体字中国語(台湾)自動音声認識モデル
ダウンロード数 220
リリース時間 : 10/31/2024
モデル概要
これは繁体字中国語(台湾)向けに最適化された自動音声認識モデルで、Common Voice 19.0台湾中国語データセットでファインチューニングされており、プロンプト不要の音声テキスト変換タスクをサポートします。
モデル特徴
繁体字中国語最適化
台湾地域の繁体字中国語音声に特化して最適化訓練を実施
大規模データセット
標準Common Voiceデータセットより4倍大きいトレーニングデータを使用(約50kサンプル)
プロンプト不要
追加プロンプトなしで直接使用可能なASRモデルとして設計
Whisper能力継承
元のWhisperモデルの言語認識能力と複数中国語バリアント対応能力を保持
モデル能力
自動音声認識
繁体字中国語音声転写
音声テキスト変換
使用事例
音声転写
会議議事録
台湾地域の中国語会議録音を自動的に文字記録に変換
単語誤り率32.56%、文字誤り率8.60%
音声メモ
日常の音声メモを検索可能なテキスト内容に変換
アクセシビリティ応用
リアルタイム字幕生成
台湾地域の動画コンテンツ向けにリアルタイム中国語字幕を生成
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98