モデル選定

XLSR-53ファインチューニング

# XLSR-53ファインチューニング

Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53

このモデルは、AI_LIGHT_DANCE - ONSET-SINGINGデータセットでfacebook/wav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルで、主に歌唱音声認識タスクに使用されます。

Wav2vec2 Large Xlsr Deepfake Audio Classification

wav2vec2アーキテクチャに基づく音声分類モデルで、ディープフェイク音声検出タスク向けにファインチューニングされており、性別認識と偽造音声検出において優れた性能を発揮します。

Wav2vec2 Large Xlsr 53 Amharic

このモデルはfacebook/wav2vec2-large-xlsr-53を基に、アムハラ語音声コーパスでファインチューニングした自動音声認識(ASR)モデルです。

Transformers その他

Exp W2v2t It Xlsr 53 S387

facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。

Transformers その他

Exp W2v2t Ja Xlsr 53 S109

facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした日本語自動音声認識モデル、Common Voice 7.0日本語データセットで学習

Transformers 日本語

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V7

wav2vec2-large-xlsr-53ベースの自動音声認識モデルで、StepManiaゲームオーディオに最適化され、GARY109/AI_LIGHT_DANCEデータセットでファインチューニング済み

Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 2

wav2vec2-large-xlsr-53モデルをファインチューニングした自動音声認識モデルで、GARY109/AI_LIGHT_DANCEデータセットでトレーニング済み

Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V3

wav2vec2-large-xlsr-53モデルをファインチューニングした自動音声認識モデルで、歌唱音声認識に特化

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V6

このモデルは、GARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2データセットでwav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルです。

Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 5gram V4 1

このモデルはwav2vec2-large-xlsr-53アーキテクチャに基づく自動音声認識(ASR)モデルで、GARY109/AI_LIGHT_DANCE - ONSET-SINGING2データセットでファインチューニングされ、歌唱音声認識タスクに主に使用されます。

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V3

wav2vec2-large-xlsr-53ベースの自動音声認識モデルで、GARY109/AI_LIGHT_DANCEデータセットでファインチューニング済み

Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53 V1

このモデルは、GARY109/AI_LIGHT_DANCE - ONSET-SINGING2データセットでwav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルで、主に歌唱音声認識タスクに使用されます。

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V2

このモデルは、GARY109/AI_LIGHT_DANCEデータセットでwav2vec2-large-xlsr-53をファインチューニングした自動音声認識モデルです

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V1

このモデルは、wav2vec2-large-xlsr-53をGARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2データセットでファインチューニングした自動音声認識モデルです。

Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53

このモデルは、facebook/wav2vec2-large-xlsr-53をAI Light Danceデータセットでファインチューニングした自動音声認識モデルです。

Ai Light Dance Chord Ft Wav2vec2 Large Xlsr 53

このモデルはfacebook/wav2vec2-large-xlsr-53をベースに、GARY109/AI_Light_Dance - ONSET-CHORD2データセットでファインチューニングした自動音声認識モデルです。

Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53

このモデルはfacebook/wav2vec2-large-xlsr-53をGARY109/AI_LIGHT_DANCE - ONSET-STEPMANIA2データセットでファインチューニングした自動音声認識モデルです

Ai Light Dance Singing Ft Wav2vec2 Large Xlsr 53 5gram V1

このモデルはwav2vec2-large-xlsr-53を基にした自動音声認識モデルで、GARY109/AI_LIGHT_DANCE - ONSET-SINGINGデータセットでファインチューニングされ、主に歌唱音声認識に使用されます。

Wav2vec2 Large Multilang Cv Ru

このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットでファインチューニングしたバージョンで、主にロシア語音声認識タスクに使用されます。

Wav2vec2 Large Xlsr 53 Tr Fine Tuning Deprecated

このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceトルコ語データセットでファインチューニングした音声認識モデルです

Wav2vec2 Large Xlsr 53 842h Luxembourgish 14h

842時間の未ラベルデータと14時間のラベル付きルクセンブルク語音声データでファインチューニングされたwav2vec2.0大規模モデル。ルクセンブルク語音声認識をサポート

Transformers その他

Wav2vec2 Common Voice Tr Demo Dist

このモデルは、facebook/wav2vec2-large-xlsr-53をCOMMON_VOICE - TRトルコ語データセットでファインチューニングした自動音声認識(ASR)モデルで、評価セットで0.3242の単語誤り率を達成しました。

Transformers その他

このモデルはfacebook/wav2vec2-large-xlsr-53を未知のデータセットでファインチューニングした音声認識モデルで、アラビア語方言(Arabizi)の認識をサポートします。

jonatasgrosman/wav2vec2-large-xlsr-53-germanを基にファインチューニングしたドイツ語音声認識モデル

Wav2vec2 Common Voice Lithuanian

このモデルはfacebook/wav2vec2-large-xlsr-53をCOMMON_VOICE - LTデータセットでファインチューニングしたバージョンで、リトアニア語音声認識に使用されます。

Transformers その他

jonatasgrosman/wav2vec2-large-xlsr-53-portugueseを基にファインチューニングしたポルトガル語自動音声認識モデル

Wav2vec2 Large Xlsr 53 Finnish

XLSR-53大規模モデルをファインチューニングしたフィンランド語音声認識モデル、16kHz音声入力に対応

音声認識その他

Fb Vindata Vi Large

このモデルは、facebook/wav2vec2-large-xlsr-53をPHONGDTD/VINDATAVLSP - NAデータセットでファインチューニングしたベトナム語自動音声認識モデルです

Wav2vec2 Large Xlsr 53 Portuguese

これはポルトガル語音声認識タスク向けにファインチューニングされたXLSR-53大規模モデルで、Common Voice 6.1データセットでトレーニングされ、ポルトガル語音声からテキストへの変換をサポートします。

音声認識その他

Wav2vec2 Large Xlsr Gu

facebook/wav2vec2-large-xlsr-53モデルを基にファインチューニングされたグジャラート語自動音声認識モデルで、OpenSLRデータセットで23.55%のWERを達成

音声認識その他

Wav2vec2 Large Xlsr 53 Dutch

facebook/wav2vec2-large-xlsr-53をファインチューニングしたオランダ語音声認識モデルで、Common VoiceとCSS10データセットでトレーニングされ、16kHz音声入力に対応しています。

音声認識その他

Wav2vec2 Common Voice Tr Demo

このモデルはfacebook/wav2vec2-large-xlsr-53をCOMMON_VOICE SV-SEデータセットでファインチューニングした自動音声認識(ASR)モデルで、スウェーデン語音声認識をサポートします。

Wav2vec2 Xlsr Khmer

facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたクメール語音声認識モデルで、OpenSLRクメール語データセットでWER24.96%を達成。

音声認識その他

Wav2vec2 Large Xlsr 53 W2V2 TATAR SMALL

このモデルはfacebook/wav2vec2-large-xlsr-53をCommon Voice 8データセットでファインチューニングしたタタール語(Tatar)自動音声認識モデルで、テストセットのWERは53.16%です。

Transformers その他

Wav2vec2 Common Voice Ab Demo

facebook/wav2vec2-large-xlsr-53モデルをCOMMON_VOICE - ABデータセットでファインチューニングした音声認識モデル

Transformers その他

patrickvonplaten

Wav2vec2 Common Voice Tr Demo

これはfacebook/wav2vec2-large-xlsr-53モデルをCOMMON_VOICE - TRトルコ語データセットでファインチューニングした自動音声認識(ASR)モデルです。

Transformers その他

Wav2vec2 Large Xlsr 53 Vietnamese

facebook/wav2vec2-large-xlsr-53モデルをベトナム語向けにファインチューニングした自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。

Transformers その他

Wav2vec2 Luganda

Facebookのwav2vec2-large-xlsr-53モデルをファインチューニングしたルガンダ語自動音声認識システムで、Common Voiceルガンダ語データセットで7.53%のWERを達成。

Transformers その他

Wav2vec2 Large Xlsr 53 Japanese

facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングした日本語音声認識モデルで、16kHzサンプリングレートの音声入力をサポート

音声認識日本語

Wav2vec2 Large Xlsr 53 Chinese Zh Cn

facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした中国語音声認識モデルで、16kHzサンプリングレートの音声入力をサポートしています。

音声認識中国語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase