W

Whisper Large V3 Ca 3catparla

Developed by projecte-aina
これはカタルーニャ語に最適化された自動音声認識モデルで、OpenAIのWhisper-large-v3をファインチューニングしたもので、バルセロナスーパーコンピューティングセンターによって開発されました。
Downloads 122
Release Time : 8/5/2024

Model Overview

このモデルはカタルーニャ語の自動音声認識タスク専用で、カタルーニャ語の音声を句読点なしのプレーンテキストに変換できます。

Model Features

高精度カタルーニャ語認識
3CatParlaテストセットで0.96のWER(単語誤り率)を達成
多方言サポート
カタルーニャ語の異なる方言バリエーションを認識可能
大規模トレーニングデータ
710時間のカタルーニャ語データを使用してファインチューニング

Model Capabilities

カタルーニャ語音声転写
自動音声認識
16kHzサンプリングレート音声処理対応

Use Cases

音声転写
放送コンテンツ転写
カタルーニャ語の放送番組を自動的にテキストに転写
3CatParlaテストセットでWER0.96
方言音声認識
異なる地域のカタルーニャ語方言を認識
異なる方言テストセットでWER7.88-12.25
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase