W

Wav2vec2 Xls R 1b Tevr

fxtentacleによって開発
これはドイツ語音声認識モデルで、wav2vec 2.0 XLS-R 1Bアーキテクチャを採用し、TEVR(マーカーエントロピー分散低減)技術を導入、5-gram言語モデルと組み合わせ、Common Voiceドイツ語テストセットで3.64%の単語誤り率を達成しました。
ダウンロード数 311
リリース時間 : 6/2/2022

モデル概要

このモデルは高性能なドイツ語自動音声認識システムで、TEVR技術によりマーカー生成プロセスを最適化し、認識精度を大幅に向上させています。

モデル特徴

TEVR技術拡張
マーカーエントロピー分散低減技術により音声認識性能を最適化し、モデルの精度を向上
高性能言語モデル統合
5-gram KenLM言語モデルを組み合わせ、認識誤り率を大幅に低減
ドイツ語最適化
ドイツ語の音声特性に特化して最適化し、ドイツ語特有の文字や発音を処理

モデル能力

ドイツ語音声からテキストへ
高精度音声認識
リアルタイム音声処理

使用事例

音声文字起こし
ドイツ語会議議事録
ドイツ語会議録音を自動的に文字記録に変換
単語誤り率3.64%以下
音声アシスタント
ドイツ語音声アシスタントに高精度音声認識機能を提供
アクセシビリティ技術
リアルタイム字幕生成
ドイツ語動画コンテンツにリアルタイム字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase