wav2vec2_10julyオープンソースのドイツ語自動音声認識モデル

ホーム

Wav2vec2 10july

sourabharshによって開発

これはXLSR Wav2Vec2アーキテクチャに基づくドイツ語自動音声認識モデルで、Common Voiceドイツ語データセットでファインチューニングされています。

音声認識

Transformers

ドイツ語オープンソースライセンス:Apache-2.0 #ドイツ語音声認識 #低文字誤り率 #XLSRファインチューニング

ダウンロード数 24

リリース時間 : 3/2/2022

モデル概要

このモデルはドイツ語音声認識タスクに使用され、ドイツ語音声をテキストに変換することができ、高い精度を有しています。

モデル特徴

高精度

Common Voiceドイツ語テストセットで10.55%の単語誤り率と2.81%の文字誤り率を達成。

XLSR Wav2Vec2ベース

先進的なXLSR Wav2Vec2アーキテクチャを使用してファインチューニングされており、ドイツ語音声認識に適しています。

オープンソースライセンス

Apache-2.0ライセンスを採用しており、商用および研究用途で利用可能です。

モデル能力

ドイツ語音声認識

音声からテキストへの変換

自動音声認識

使用事例

音声文字起こし

ドイツ語会議議事録

ドイツ語会議録音を自動的にテキストに変換

89.45%の高精度（WER 10.55%ベース）

ドイツ語音声アシスタント

ドイツ語音声アシスタントに音声認識機能を提供

アクセシビリティアプリケーション

リアルタイム字幕生成

ドイツ語動画コンテンツにリアルタイムで字幕を生成

属性	詳情
データセット	Common Voice ドイツ語版

指標	値
WER (Word Error Rate)	10.55
CER (Character Error Rate)	2.81

モデル名	説明
XLSR Wav2Vec2 German by Jonatas Grosman	ドイツ語用に微調整された XLSR Wav2Vec2 モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 10july

モデル概要

モデル特徴

モデル能力

使用事例

🚀 XLSR Wav2Vec2 ドイツ語モデル

📚 詳細ドキュメント

データセット

評価指標

タグ

ライセンス

モデル情報

タスクと結果