Wav2vec2 Large Xlsr 53 Dutch
Facebookが開発したWav2Vec 2.0アーキテクチャに基づくオランダ語自動音声認識(ASR)モデルで、XLSR - 53多言語事前学習モデルを微調整しています。
Downloads 203
Release Time : 3/2/2022
Model Overview
このモデルはオランダ語の音声をテキストに変換するタスクに特化しており、大規模な自己教師付き学習で事前学習され、Common Voiceオランダ語データセットで微調整されています。
Model Features
多言語事前学習の基礎
XLSR - 53多言語モデルを微調整しており、強力な言語間音声特徴表現能力を引き継いでいます。
高い正確率
Common Voiceオランダ語テストセットで21.1%の単語誤り率(WER)を達成しています。
エンドツーエンド音声認識
生のオーディオ入力から直接テキスト出力を生成し、従来のASRシステムの複雑なパイプラインは必要ありません。
Model Capabilities
オランダ語音声認識
オーディオをテキストに変換
音声文字起こし
Use Cases
音声文字起こし
オランダ語音声文字起こし
オランダ語の音声内容を自動的に文字記録に変換します。
21.1%単語誤り率(Common Voiceテストセット)
支援技術
音声制御アプリケーション
オランダ語ユーザーに音声制御インターフェースを提供します。
Featured Recommended AI Models
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers Supports Multiple Languages

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers English

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム Chinese
R
uer
2,694
98