モデル選定

低WERモデル

# 低WERモデル

Distil Whisper Large V3 Ptbr

これはdistil-whisper-large-v3の微調整バージョンで、ブラジルポルトガル語の自動音声認識（ASR）に特化しており、Common Voice 16データセットと私有データセットを組み合わせて訓練されています。

Ascend With English

timit_asrデータセットを使用してascendモデルをファインチューニングした英語音声認識モデル

Xls R 300m Sv Robust

これはKBLab/wav2vec2-large-voxrexを基に、スウェーデン語Common Voiceデータセットでファインチューニングした自動音声認識モデルです

Transformers その他

Wav2vec2 Large Xlsr Mr 2

これはfacebook/wav2vec2-large-xlsr-53モデルを基に、マラーティー語でファインチューニングした自動音声認識(ASR)モデルで、InterSpeech 2021マラーティー語データセットの一部を使用してトレーニングされました。

音声認識その他

Unispeech Large 1500h Cv Timit

このモデルはmicrosoft/unispeech-large-1500h-cvをTIMIT_ASRデータセットでファインチューニングした自動音声認識モデルで、評価セットで21.96%の単語誤り率(WER)を達成しました。

patrickvonplaten

XLSRアーキテクチャを基にファインチューニングしたインドネシア語自動音声認識(ASR)モデル、Common Voiceインドネシア語データセットでトレーニング

Transformers その他

Wav2vec2 Large Xlsr 53 Eu

facebook/wav2vec2-large-xlsr-53モデルを基に、Common Voiceデータセットでバスク語にファインチューニングした音声認識モデルです。

enterprise-explorers

Xls R 300m It Phoneme

facebook/wav2vec2-xls-r-300mをイタリア語データセットでファインチューニングした音声認識モデル

patrickvonplaten

Bp500 Base10k Voxpopuli

これはブラジルポルトガル語に最適化されたWav2vec 2.0音声認識モデルで、複数のブラジルポルトガル語データセットでファインチューニングされています

Transformers その他

Wav2vec2 Large Xlsr Indonesian

facebook/wav2vec2-large-xlsr-53をベースに微調整されたインドネシア語自動音声認識モデルで、Common Voiceインドネシア語データセットで訓練され、テストのWERは25.86%です。

音声認識その他

Wav2vec2 Large Xlsr Gl

Facebookのwav2vec2-large-xlsr-53モデルをファインチューニングしたガリシア語自動音声認識(ASR)モデルで、OpenSLR 77データセットで16.79%のWERを達成

スペイン語Common Voiceデータセットでファインチューニングされた音声認識モデル。facebook/wav2vec2-xls-r-300mアーキテクチャ採用。テストセットでWER14.6%を達成

Transformers スペイン語

Wav2vec2 Large Xlsr 53 Turkish

これはFacebookのwav2vec2-large-xlsr-53モデルをトルコ語Common Voiceデータセットでファインチューニングした自動音声認識モデルです。

音声認識その他

Hindi Base Wav2vec2

これはwav2vec2アーキテクチャに基づくヒンディー語の自動音声認識(ASR)モデルで、Common Voiceなどのデータセットで訓練されています。

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase