B

Breeze ASR 25

Developed by MediaTek-Research
Breeze ASR 25は、Whisper-large-v2を微調整した高度な自動音声認識モデルで、台湾普通話と普通話 - 英語のコード切り替えシナリオの認識能力を特別に最適化しています。
Downloads 10.33k
Release Time : 6/6/2025

Model Overview

Breeze ASR 25は高性能の自動音声認識モデルで、台湾普通話と普通話 - 英語のコード切り替えシナリオに対して最適化されており、自動字幕生成などのタスクに適しています。

Model Features

台湾普通話の最適化
台湾普通話の音声内容をより正確に認識できます
コード切り替えのサポート
普通話 - 英語のコード切り替えシナリオをサポートし、文内切り替えと文間切り替えを含みます
時間合わせの強化
より正確な時間合わせ機能を提供し、自動字幕生成に適しています
高性能
複数のベンチマークテストでWhisper-large-v2よりも優れた性能を発揮します

Model Capabilities

音声認識
多言語サポート
コード切り替え認識
時間合わせ

Use Cases

字幕生成
自動字幕生成
ビデオコンテンツに正確な時間合わせの字幕を生成します
Whisper-large-v2と比較して認識精度が向上しました
音声書き起こし
台湾普通話の書き起こし
台湾普通話の内容を正確に書き起こします
CommonVoice16 - zh - TWデータセットでWERRが19%低下しました
コード切り替えの書き起こし
普通話 - 英語の混合音声内容を処理します
CSZS - zh - enデータセットでWERRが55.88%低下しました
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase