モデル選定

ドイツ語音声認識

# ドイツ語音声認識

Whisper Medium Cv11 German Ct2

OpenAIのwhisper-mediumモデルをCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデル

Transformers ドイツ語

German RAG WHISPER LARGE V3 TURBO HESSIAN AI

Whisper Large v3 Turboを基に最適化されたドイツ語音声認識モデル。13時間の精選データセットで微調整され、ドイツ語認識精度が大幅に向上

Transformers ドイツ語

Whisper Large V3 Turbo German Ct2

Whisper Large v3をベースとしたドイツ語音声認識モデル、ドイツ語音声処理と認識に最適化

Transformers ドイツ語

Whisper Large V3 Turbo German

Whisper Large v3を基にしたドイツ語音声認識のファインチューニングモデルで、ドイツ語音声処理と認識に特化して最適化されています。

Transformers ドイツ語

Distil Whisper Large V3 German

distil-whisper技術に基づくドイツ語音声認識モデルで、パラメータ数は7.56億、高品質を維持しながらより高速な推論を実現。

Transformers ドイツ語

Whisper Tiny German

whisper-tinyをベースとしたドイツ語音声認識モデルで、パラメータ数は3780万、モデルサイズに敏感なエッジシナリオに適しています。

Transformers ドイツ語

Whisper Large V3 German

Whisper Large v3を基にしたドイツ語音声認識のファインチューニングモデルで、ドイツ語音声処理と認識に最適化されています

Transformers ドイツ語

Stt De Fastconformer Hybrid Large Pc

これはFastConformerアーキテクチャに基づくドイツ語自動音声認識モデルで、トランスフォーマーとCTCのハイブリッド訓練方式を採用し、パラメータ規模は約115Mです。

音声認識ドイツ語

Whisper Large V2 Cv11 German

openai/whisper-large-v2をCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデルで、ドイツ語音声をテキストに変換可能、単語誤り率5.76

Transformers ドイツ語

Whisper Small Cv11 German

openai/whisper-smallをCommon Voice 11.0ドイツ語データセットで微調整した音声認識モデルで、ドイツ語音声をテキストに変換し、大文字小文字と句読点を予測します。

Transformers ドイツ語

Stt De Conformer Transducer Large

これはドイツ語の自動音声認識用の大規模なConformer-Transducerモデルで、約1.2億のパラメータを持ち、ドイツ語音声をテキストに変換します。

音声認識ドイツ語

Stt De Conformer Ctc Large

これはドイツ語自動音声認識のための大規模Conformer-CTCモデルで、NVIDIAが数千時間のドイツ語音声データでトレーニングおよび最適化しました。

音声認識ドイツ語

Wav2vec2 Large Xlsr 53 German Cv9

これはFacebookのwav2vec2-large-xlsr-53モデルを基に、ドイツ語Common Voice 9.0データセットでファインチューニングした自動音声認識(ASR)モデルです。

Transformers ドイツ語

Wav2vec2 Xls R 1b Tevr

これはドイツ語音声認識モデルで、wav2vec 2.0 XLS-R 1Bアーキテクチャを採用し、TEVR（マーカーエントロピー分散低減）技術を導入、5-gram言語モデルと組み合わせ、Common Voiceドイツ語テストセットで3.64%の単語誤り率を達成しました。

Transformers ドイツ語

jonatasgrosman/wav2vec2-large-xlsr-53-germanを基にファインチューニングしたドイツ語音声認識モデル

Wav2vec2 Large Xls R 300m German With Lm

facebook/wav2vec2-xls-r-300mをCommon Voiceドイツ語データセットでファインチューニングした音声認識モデル、n-gram言語モデルを統合、単語誤り率8.8%

Wav2vec2 Large Xlsr 53 German With Lm

これはXLSR Wav2Vec2アーキテクチャに基づくドイツ語自動音声認識モデルで、言語モデルサポートを備えており、Common Voiceドイツ語データセットで優れた性能を発揮します。

Transformers ドイツ語

Wav2vec2 Large Xlsr German

Facebookのwav2vec2-large-xlsr-53モデルをベースに、Common Voiceドイツ語データセットで微調整された自動音声認識(ASR)モデル

音声認識ドイツ語

Wav2vec2 Large Xlsr German Demo

facebook/wav2vec2-large-xlsr-53を基にドイツ語Common Voiceデータセットでファインチューニングした音声認識モデル、単語誤り率29.35%

音声認識ドイツ語

Phoneme Test 5 Sv

このモデルは、facebook/wav2vec2 - xls - r - 300mをMULTILINGUAL_LIBRISPEECH - ドイツ語10時間データセットで微調整したバージョンで、ドイツ語音声認識タスクに使用されます。

patrickvonplaten

Wav2vec2 Xlsr 300m German Truecase

Facebookのwav2vec2-xls-r-300mモデルを基に、Common Voiceドイツ語データセットでファインチューニングされ、ドイツ語音声認識をサポートしテキストの大文字小文字情報を保持します。

Wav2vec2 Large Xlsr 53 German

facebook/wav2vec2-large-xlsr-53をベースに、Common Voiceのドイツ語データセットで微調整した自動音声認識モデルで、テストのWERは15.80%です。

音声認識ドイツ語

Wav2vec2 Base De Voxpopuli V2

Facebook Wav2Vec2アーキテクチャに基づくドイツ語音声事前学習モデルで、VoxPopuliコーパスの23.2kの未ラベルドイツ語データを使用して事前学習されています。

Transformers ドイツ語

German Pretrained

このモデルはflozi00/wav2vec-xlsr-germanを微調整したドイツ語音声認識モデルで、評価セットでの単語誤り率は1.0です。

Wav2vec2 Large Xlsr 53 German Gpt2

これはMOZILLA-FOUNDATION/COMMON_VOICE_7_0ドイツ語データセットでトレーニングされた自動音声認識エンコーダ-デコーダモデルで、Wav2Vec2とGPT2アーキテクチャの利点を組み合わせています。

Transformers ドイツ語

flozi00/wav2vec - xlsr - germanをベースに微調整されたドイツ語音声認識モデル

Wav2vec2 Xls R 1b German

これはXLS - R 1Bアーキテクチャに基づくドイツ語自動音声認識モデルで、Common Voice 8.0などの複数のドイツ語音声データセットで微調整されています。

Transformers ドイツ語

このモデルは、flozi00/wav2vec-xlsr-germanをベースに微調整されたドイツ語音声認識モデルで、主にドイツ語の音声をテキストに変換するタスクに使用されます。

Wav2vec2 100m Mls German Ft

このモデルはfacebook/wav2vec2-xls-r-100mを多言語LibriSpeechドイツ語データセットでファインチューニングした自動音声認識モデルです

patrickvonplaten

Wav2vec2 10july

これはXLSR Wav2Vec2アーキテクチャに基づくドイツ語自動音声認識モデルで、Common Voiceドイツ語データセットでファインチューニングされています。

Transformers ドイツ語

Wav2vec2 100m Mls German Ft 2

facebook/wav2vec2-xls-r-100mモデルをMULTILINGUAL_LIBRISPEECH - GERMANデータセットでファインチューニングしたドイツ語自動音声認識モデル

patrickvonplaten

Wav2vec2 Base 10k Voxpopuli Ft De

Facebook Wav2Vec2ベースモデルを基に、VoxPopuliコーパスの10K無注釈サブセットで事前学習し、ドイツ語転写データでファインチューニングした音声認識モデル

Transformers ドイツ語

Wav2vec2 Xls R 1b De Cv8

facebook/wav2vec2-xls-r-1bをCommon Voice 8ドイツ語データセットでファインチューニングした自動音声認識モデル

Transformers ドイツ語

Wav2vec2 Large Xlsr 53 German

FacebookのWav2Vec2アーキテクチャに基づく大規模ドイツ語自動音声認識(ASR)モデルで、Common Voiceドイツ語データセットで微調整されています。

音声認識ドイツ語

Wav2vec2 Large Xlsr 53 German

これはドイツ語音声認識タスクに対して微調整されたXLSR - 53の大規模モデルで、Facebookのwav2vec2-large-xlsr-53モデルをベースに、Common Voice 6.1ドイツ語データセットで微調整されました。

音声認識ドイツ語

Wav2vec2 Large Xlsr 53 German

wav2vec-large-xlsr-53フレームワークを基に微調整されたドイツ語音声認識モデルで、CommonVoiceドイツ語テストセットで11.26%の単語誤り率を達成しました。

Wav2vec2 Xls R 300m German De

このモデルは、facebook/wav2vec2 - xls - r - 300mをベースに、MOZILLA - FOUNDATION/COMMON_VOICE_7_0 - DEデータセットで微調整されたドイツ語自動音声認識モデルです。

Transformers ドイツ語

Wav2vec2 Xls R 1B German

このモデルは、facebook/wav2vec2 - xls - r - 1bをMOZILLA - FOUNDATION/COMMON_VOICE_8_0 - ドイツ語データセットで微調整したバージョンで、ドイツ語の自動音声認識タスクに使用されます。

Transformers ドイツ語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase