W

Whisper Large V3 Ca 3catparla

projecte-ainaによって開発
これはカタルーニャ語に最適化された自動音声認識モデルで、OpenAIのWhisper-large-v3をファインチューニングしたもので、バルセロナスーパーコンピューティングセンターによって開発されました。
ダウンロード数 122
リリース時間 : 8/5/2024

モデル概要

このモデルはカタルーニャ語の自動音声認識タスク専用で、カタルーニャ語の音声を句読点なしのプレーンテキストに変換できます。

モデル特徴

高精度カタルーニャ語認識
3CatParlaテストセットで0.96のWER(単語誤り率)を達成
多方言サポート
カタルーニャ語の異なる方言バリエーションを認識可能
大規模トレーニングデータ
710時間のカタルーニャ語データを使用してファインチューニング

モデル能力

カタルーニャ語音声転写
自動音声認識
16kHzサンプリングレート音声処理対応

使用事例

音声転写
放送コンテンツ転写
カタルーニャ語の放送番組を自動的にテキストに転写
3CatParlaテストセットでWER0.96
方言音声認識
異なる地域のカタルーニャ語方言を認識
異なる方言テストセットでWER7.88-12.25
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase