モデル選定

ロバスト音声処理

# ロバスト音声処理

Wav2vec2 Large Robust 6 Ft Age Gender Finetuned Gtzan

wav2vec2アーキテクチャに基づく音声分類モデルで、privateSLIデータセットで微調整され、年齢と性別認識タスクに使用されます

languageresearch

Xls R 300 Sv Cv7

これはfacebook/wav2vec2-xls-r-300mをスウェーデン語Common Voice 7.0データセットでファインチューニングした自動音声認識モデルです

Transformers その他

patrickvonplaten

Wav2vec2 Xls R 300m Indonesian

FacebookのXLS-R-300Mモデルをインドネシア語音声データでファインチューニングした自動音声認識モデル

Transformers その他

Wav2vec2 Large Xls R 1b Indonesian

facebook/wav2vec2-xls-r-1bをCommon Voiceインドネシア語データセットでファインチューニングした自動音声認識モデル

Transformers その他

Wav2vec2 Large Xls R 300m Hindi

これはfacebook/wav2vec2-xls-r-300mモデルをヒンディー語データセットでファインチューニングした音声認識モデルで、ヒンディー語音声からテキストへの変換タスクをサポートします。

Transformers その他

Wav2vec2 Xls R 300m Turkish Tr Small

これはfacebook/wav2vec2 - xls - r - 300mモデルを汎用音声データセットで微調整したトルコ語音声認識モデルです。

Wav2vec2 Base Turkish

このモデルはCommon Voiceトルコ語データセットでファインチューニングされたWav2Vec2音声認識モデルで、トルコ語自動音声認識タスクで優れた性能を発揮します。

Transformers その他

Wav2vec2 Xls R 1b Korean

このモデルは、facebook/wav2vec2-xls-r-1bをKRESNIK/ZEROTH_KOREAN - CLEANデータセットでファインチューニングした韓国語自動音声認識モデルです。

Transformers 韓国語

Wav2vec2 Large Xlsr 53 Demo Colab

このモデルは、facebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットで微調整した音声認識モデルで、主にロバスト音声イベント認識に使用されます。

Wav2vec2 Xls R 300m Lm Hebrew

facebook/wav2vec2-xls-r-300mをベースに微調整されたヘブライ語音声認識モデルで、n-gram言語モデルが追加され強化されています。

Transformers その他

Wav2vec2 Large Xls R 300m Latvian

これはfacebook/wav2vec2-xls-r-300mをラトビア語データセットでファインチューニングした自動音声認識モデルで、Common Voice 7テストセットで16.98%のWERを達成しました。

Transformers その他

Wav2vec2 Xls R Pt Cv7 From Bp400h

これはwav2vec2 XLS-Rアーキテクチャに基づくポルトガル語自動音声認識(ASR)モデルで、Common Voice 7データセットでファインチューニングされ、テストセットで12.13%の単語誤り率(WER)を達成しました。

Transformers その他

Wav2vec2 Xls R 1b De Cv8

facebook/wav2vec2-xls-r-1bをCommon Voice 8ドイツ語データセットでファインチューニングした自動音声認識モデル

Transformers ドイツ語

Wav2vec2 Indonesian Javanese Sundanese

これはインドネシア語、ジャワ語、スンダ語をサポートする多言語音声認識モデルで、facebook/wav2vec2-large-xlsr-53をファインチューニングして作成されました。

Transformers その他

これはfacebook/wav2vec2-xls-r-2bモデルをファインチューニングしたテルグ語自動音声認識(ASR)モデルで、OpenSLR SLR66データセットでトレーニングされました

Transformers その他

Wav2vec2 Large Xls R 300m Sl With LM V1

これはfacebook/wav2vec2-xls-r-300mモデルをベースに、スロベニア語(Common Voice 8.0)データセットで微調整した自動音声認識(ASR)モデルで、言語モデル(LM)を組み合わせることで認識精度が向上しています。

Transformers その他

Wav2vec2 Large Xls R 300m Sat Final

これはfacebook/wav2vec2-xls-r-300mを基に、MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - SATデータセットでファインチューニングされた自動音声認識モデルで、Santali (Ol Chiki)言語をサポートしています。

Transformers その他

Wav2vec2 Xls R 300m German De

このモデルは、facebook/wav2vec2 - xls - r - 300mをベースに、MOZILLA - FOUNDATION/COMMON_VOICE_7_0 - DEデータセットで微調整されたドイツ語自動音声認識モデルです。

Transformers ドイツ語

Xls R 2b Nl V2 Lm 5gram Os2 Hunspell

XLS-RベースのCTCモデルで、Open Subtitlesの5-gram言語モデルを搭載し、主にオランダ語とフラマン語の自動音声認識に使用されます。

Transformers その他

Wav2vec2 Large Xlsr 53 Demo Colab

これはwav2vec2アーキテクチャに基づく自動音声認識モデルで、タミル語に特化して最適化されており、ネパール語音声認識タスクをサポートします。

Transformers その他

Wav2vec2 Large Xls R 300m Cv8 Nl

facebook/wav2vec2-xls-r-300mをCommon Voice 8オランダ語データセットでファインチューニングした自動音声認識モデル。6-gram KenLM言語モデルを含む

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase