wav2vec2-xls-r-300m-ftspeechオープンソースモデル - デンマーク語の自動音声認識を正確に実現

ホーム

Wav2vec2 Xls R 300m Ftspeech

saattrupdanによって開発

facebook/wav2vec2-xls-r-300mを基にデンマーク議会音声データセットで微調整したデンマーク語自動音声認識モデル

音声認識

Transformers

その他オープンソースライセンス:その他 #デンマーク語音声認識 #議会シーン最適化 #低単語誤り率

ダウンロード数 1.3M

リリース時間 : 3/4/2022

モデル概要

これはデンマーク語自動音声認識(ASR)のためのモデルで、wav2vec2-xls-r-300mアーキテクチャを基に、1,800時間のデンマーク議会演説データで微調整されています。

モデル特徴

デンマーク語最適化

デンマーク語音声認識に特化して最適化され、デンマーク議会音声データセットで微調整されています

高性能

Common Voice 8.0デンマーク語セクションとAlvenirテストセットで低い単語誤り率を達成

言語モデルサポート

5-gram言語モデルを使用して認識精度をさらに向上させることをサポート

モデル能力

デンマーク語音声認識

音声からテキストへの変換

5-gram言語モデルによる精度向上サポート

使用事例

音声文字起こし

議会演説文字起こし

デンマーク議会演説内容を自動的にテキストに変換

議会データセットで訓練されており、この種の内容認識に適しています

汎用音声認識

日常会話文字起こし

デンマーク語の日常会話をテキストに変換

Common VoiceデータセットでWERが17.91

データセット	LMなしのWER	5-gram LMありのWER
Common Voice 8.0のデンマーク語部分	20.48	17.91
Alvenirテストセット	15.46	13.84

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Wav2vec2 Xls R 300m Ftspeech

モデル概要

モデル特徴

モデル能力

使用事例

🚀 XLS-R-300m-FTSpeech

🚀 クイックスタート

✨ 主な機能

📚 ドキュメント

モデルの説明

性能

📄 ライセンス