W

Whosper Large V2

CAYTUによって開発
Whosper-large-v2は、セネガルの主要言語であるウォロフ語に特化した最先端の音声認識モデルで、OpenAIのWhisper-large-v2を基に構築されており、単語誤り率(WER)と文字誤り率(CER)を大幅に改善しています。
ダウンロード数 449
リリース時間 : 1/15/2025

モデル概要

このモデルはウォロフ語の音声認識に焦点を当てつつ、フランス語と英語もサポートし、優れたコードスイッチング能力を備えており、会話の書き起こし、言語学習ツールの構築、または研究に適しています。

モデル特徴

優れたコードスイッチング
ウォロフ語とフランス語/英語の混合を自然に処理し、現実世界の音声パターンを反映
多言語サポート
ウォロフ語に加え、フランス語と英語でも優れた性能を発揮
プロダクション対応
包括的なテストと最適化を経ており、デプロイに適している
オープンソース
apache-2.0ライセンスで公開されており、研究開発に最適
アフリカ自然言語処理への注力
より広範なアフリカ言語サポートの実現を目指す

モデル能力

ウォロフ語音声認識
フランス語音声認識
英語音声認識
コードスイッチング処理

使用事例

音声書き起こし
会話の書き起こし
ウォロフ語の会話内容を書き起こす
WER 0.2345, CER 0.1101
教育
言語学習ツール
ウォロフ語学習アプリの音声認識コンポーネントを構築
研究
アフリカ言語処理研究
アフリカ言語の音声認識関連研究に利用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase