モデル選定

スウェーデン語音声認識

# スウェーデン語音声認識

Kb Whisper Tiny

スウェーデン国立図書館が公開したWhisperモデルで、スウェーデン語音声認識に特化して最適化されており、OpenAIのオリジナル版と比べて誤り率が大幅に低下しています。

Transformers その他

Kb Whisper Small

スウェーデン国立図書館が公開したWhisperモデルで、スウェーデン語に最適化されており、50,000時間以上のスウェーデン語音声データでトレーニングされ、OpenAIのオリジナル版を上回る性能

Transformers その他

Kb Whisper Medium

スウェーデン国立図書館が5万時間以上のスウェーデン語音声で訓練したWhisperモデルで、スウェーデン語音声認識タスクで優れた性能を発揮

Transformers その他

Kb Whisper Large

スウェーデン国立図書館が公開したWhisperアーキテクチャに基づくスウェーデン語音声認識モデルで、5万時間以上のトレーニングデータを使用し、単語誤り率を大幅に低減しています。

Transformers その他

Exp W2v2t Sv Se R Wav2vec2 S418

facebook/wav2vec2-large-robustモデルをファインチューニングしたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。

Exp W2v2t Sv Se Vp Nl S842

これはfacebook/wav2vec2-large-nl-voxpopuliモデルをファインチューニングしたスウェーデン語自動音声認識モデルで、Common Voice 7.0 (sv-SE)データセットを使用してトレーニングされました。

Exp W2v2t Sv Se Wavlm S42

microsoft/wavlm-largeをベースに微調整されたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力に適しています。

Wav2vec2 Large Voxrex Swedish 4gram

これはスウェーデン語の自動音声認識(ASR)用モデルで、VoxRex-C音響モデルとソーシャルメディアデータに基づく4-gram言語モデルを統合しています。

Transformers その他

Xls R 300 Sv Cv7

これはfacebook/wav2vec2-xls-r-300mをスウェーデン語Common Voice 7.0データセットでファインチューニングした自動音声認識モデルです

Transformers その他

patrickvonplaten

Xls R 300m Sv Robust

これはKBLab/wav2vec2-large-voxrexを基に、スウェーデン語Common Voiceデータセットでファインチューニングした自動音声認識モデルです

Transformers その他

Wav2vec2 Swedish Common Voice

これはfacebook/wav2vec2-large-xlsr-53モデルをベースに、スウェーデン語のCommon Voiceデータセットで微調整された音声認識モデルで、学習データ量は402MBです。

音声認識その他

Wav2vec2 Large Xlsr Swedish

これはXLSR-53アーキテクチャに基づくスウェーデン語自動音声認識モデルで、Common Voiceデータセットでファインチューニングされています。

音声認識その他

Wav2vec2 Common Voice Tr Demo

このモデルはfacebook/wav2vec2-large-xlsr-53をCOMMON_VOICE SV-SEデータセットでファインチューニングした自動音声認識(ASR)モデルで、スウェーデン語音声認識をサポートします。

Wav2vec2 Speechdat

このモデルは、facebook/wav2vec2-large-xlsr-53をベースに、COMMON_VOICE - SV-SEデータセットで微調整されたスウェーデン語自動音声認識モデルです。

Wav2vec2 Base Sv Voxpopuli V2

Facebook Wav2Vec2アーキテクチャに基づく音声モデルで、スウェーデン語に特化して事前学習されており、VoxPopuliコーパスの16.3kの未ラベルデータを使用しています。

Transformers その他

Wav2vec2 Large Xls R 1b Swedish

このモデルは、facebook/wav2vec2-xls-r-1bをCommon Voiceのスウェーデン語データセットで微調整した自動音声認識モデルで、スウェーデン語の音声をテキストに変換するタスクをサポートしています。

Transformers その他

Wav2vec2 Base Sv Voxpopuli

VoxPopuliコーパスのスウェーデン語サブセットで事前学習されたWav2Vec2ベースモデルで、スウェーデン語音声認識タスクに適しています。

Transformers その他

Xls R 300m It Cv8

このモデルはCommon Voiceスウェーデン語データセットを使用してfacebook/wav2vec2-xls-r-300mをファインチューニングした音声認識モデルで、評価セットで1.0286の単語誤り率(WER)を達成しました。

facebook/wav2vec2-xls-r-300mをベースに、スウェーデン語データセットで微調整した自動音声認識モデル

Transformers その他

Wav2vec2 Base Voxpopuli Sv Swedish

FacebookのVoxPopuli-svベース版モデルをベースに、NSTとCommon Voiceのデータを使って微調整されたスウェーデン語音声認識モデルです。

Wav2vec2 Large Voxrex Swedish

VoxRex大型モデルを微調整したスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。

Transformers その他

Wav2vec2 Large Voxpopuli Sv Swedish

このモデルはFacebookのVoxPopuli-sv largeモデルをベースに、スウェーデンのラジオ番組、NST、Common Voiceのデータを追加で事前学習と微調整したスウェーデン語音声認識モデルです。

Wav2vec2 Large Xlsr 53 Swedish

facebook/wav2vec2-large-xlsr - 53フレームワークに基づいて微調整されたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。

音声認識その他

Wav2vec2 Large Xlsr 53 Swedish

これは、facebook/wav2vec2-large-xlsr-53モデルをベースに、スウェーデン語のCommon Voiceデータセットで微調整された自動音声認識（ASR）モデルです。

MehdiHosseiniMoghadam

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase