W

Wav2vec2 10july

sourabharshによって開発
これはXLSR Wav2Vec2アーキテクチャに基づくドイツ語自動音声認識モデルで、Common Voiceドイツ語データセットでファインチューニングされています。
ダウンロード数 24
リリース時間 : 3/2/2022

モデル概要

このモデルはドイツ語音声認識タスクに使用され、ドイツ語音声をテキストに変換することができ、高い精度を有しています。

モデル特徴

高精度
Common Voiceドイツ語テストセットで10.55%の単語誤り率と2.81%の文字誤り率を達成。
XLSR Wav2Vec2ベース
先進的なXLSR Wav2Vec2アーキテクチャを使用してファインチューニングされており、ドイツ語音声認識に適しています。
オープンソースライセンス
Apache-2.0ライセンスを採用しており、商用および研究用途で利用可能です。

モデル能力

ドイツ語音声認識
音声からテキストへの変換
自動音声認識

使用事例

音声文字起こし
ドイツ語会議議事録
ドイツ語会議録音を自動的にテキストに変換
89.45%の高精度(WER 10.55%ベース)
ドイツ語音声アシスタント
ドイツ語音声アシスタントに音声認識機能を提供
アクセシビリティアプリケーション
リアルタイム字幕生成
ドイツ語動画コンテンツにリアルタイムで字幕を生成
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase