wav2vec2 - xls - r - 1b - de - cv8オープンソース自動音声認識モデル - ドイツ語の音声内容を高精度に認識する

ホーム

Wav2vec2 Xls R 1b De Cv8

jsnflyによって開発

facebook/wav2vec2-xls-r-1bをCommon Voice 8ドイツ語データセットでファインチューニングした自動音声認識モデル

音声認識

Transformers

ドイツ語オープンソースライセンス:Apache-2.0 #ドイツ語音声認識 #高精度WER11.37 #Common Voiceファインチューニング

ダウンロード数 22

リリース時間 : 3/2/2022

モデル概要

これはドイツ語に最適化された自動音声認識(ASR)モデルで、XLS-R-1Bアーキテクチャに基づき、Common Voice 8ドイツ語データセットでファインチューニングされています。

モデル特徴

高性能ドイツ語認識

Common Voice 8ドイツ語テストセットで11.37%の単語誤り率(WER)と2.89%の文字誤り率(CER)を達成

大規模事前学習

10億パラメータのXLS-Rアーキテクチャに基づき、強力な音声特徴抽出能力を有する

ロバストな性能

より挑戦的なロバスト音声イベントデータセットでも良好な認識性能を維持

モデル能力

ドイツ語音声認識

音声からテキストへの変換

異なるアクセントのドイツ語処理

使用事例

音声文字起こし

ドイツ語音声からテキストへ

ドイツ語音声コンテンツをテキスト形式に変換

標準テストセットで11.37%の単語誤り率を達成

音声アシスタント

ドイツ語音声コマンド認識

ドイツ語音声アシスタントや音声制御システムの音声認識コンポーネントとして使用

属性	詳細
モデルタイプ	自動音声認識（Automatic Speech Recognition）
学習データ	MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - DE

評価指標	値
テストWER	11.37
テストCER	2.89

評価指標	値
開発WER	31.16
開発CER	13.41

評価指標	値
テストWER	36.79

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 Xls R 1b De Cv8

モデル概要

モデル特徴

モデル能力

使用事例

🚀 XLS-R-1b-DE

✨ 主な機能

📦 インストール

💻 使用例

📚 ドキュメント

モデル情報

評価結果

Common Voice 8

Robust Speech Event - Dev Data

Robust Speech Event - Test Data

🔧 技術詳細

📄 ライセンス