# 低単語誤り率

Phi 4 Mm Inst Asr Singlish
MIT
シンガポール英語に最適化されたマルチモーダル音声認識モデルで、マイクロソフトのPhi-4マルチモーダル命令モデルをファインチューニングし、シンガポール英語の独特な音声特徴の認識能力を大幅に向上させました。
音声生成テキスト Transformers 複数言語対応
P
mjwong
61
0
Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
このモデルはfacebook/wav2vec2-baseをLibriSpeechデータセットでファインチューニングした音声認識モデルで、評価セットで0.3174の単語誤り率を達成しました。
音声認識 Transformers
W
vishwasgautam
14
0
Whisper Small Vi
MIT
openai/whisper-smallをベースにベトナム語音声データ向けにファインチューニングした自動音声認識モデルで、ベトナム語の文字起こし精度と頑健性を向上
音声認識 Transformers その他
W
namphungdn134
334
2
Whisper Large V3 French Distil Dec16 Ct2
MIT
これはWhisper Large V3のフランス語蒸留バージョンで、フランス語自動音声認識に最適化されており、ctranslate2による効率的な推論を実現しています。
音声認識 フランス語
W
Kelno
35
1
W2v Bert 2.0 Naijavoices Clearglobal Hausa 500hr V0
MIT
facebook/w2v-bert-2.0をファインチューニングしたハウサ語音声認識モデルで、500時間のハウサ語データで訓練され、単語誤り率7.47%
音声認識 Transformers
W
asr-africa
16
1
Whisper Persian Turbooo
MIT
OpenAI Whisper-large-v3-turboを最適化したペルシャ語自動音声認識モデル、医療分野のアプリケーションをサポート
音声認識 Transformers その他
W
hackergeek98
51
2
Whisper Base Vi
MIT
openai/whisper-baseモデルを100時間のベトナム語音声データでファインチューニングした音声認識モデルで、ベトナム語文字起こしの精度を向上
音声認識 Transformers その他
W
namphungdn134
215
3
Whisper Large V3 Persian Common Voice 17
MIT
Whisper Large v3をベースにファインチューニングしたペルシア語自動音声認識モデルで、Common Voice 17データセットで訓練されており、ペルシア語の認識精度が大幅に向上しています。
音声認識 Transformers その他
W
msghol
442
2
Whisper Large V3 Vaani Hindi
Apache-2.0
OpenAIのWhisper-Large-V3モデルをファインチューニングしたヒンディー語音声認識モデルで、約718時間のヒンディー語音声データで訓練されています
音声認識 Safetensors
W
ARTPARK-IISc
15.55k
3
Indian Accent English Whisper Finetuned Epoch 15
MIT
OpenAI Whisper-large-v3-turboをファインチューニングしたインド英語アクセント音声認識モデルで、インド英語アクセントデータセットで7.99%の単語誤り率を達成
音声認識 Transformers 英語
I
Tejveer12
21
2
Wav2vec2 Large Xlsr 53 Hungarian
Apache-2.0
facebook/wav2vec2-large-xlsr-53を基に、ハンガリー語Common Voiceデータセットでファインチューニングした自動音声認識モデル
音声認識 Transformers その他
W
sarpba
17
1
Whisper Small Fr
Apache-2.0
これはフランス語データセットでファインチューニングされたWhisper-small音声認識モデルで、単語誤り率がベースラインモデルに比べて6.793ポイント低下しています。
音声認識 Transformers フランス語
W
mozilla-ai
30
1
Lite Whisper Large V3 Turbo Acc
Apache-2.0
Lite-Whisper は LiteASR 技術で圧縮された OpenAI Whisper の軽量版で、高い精度を維持しながらモデルサイズを縮小しています。
音声認識 Transformers
L
efficient-speech
7,414
7
Whisper Uz
Apache-2.0
OpenAI Whisper Mediumモデルをファインチューニングしたウズベク語自動音声認識モデル
音声認識 Transformers その他
W
mustafoyev202
110
1
Whisper Finetuned
MIT
Whisper-large-v3-turboを微調整したインド英語アクセント音声認識モデル、単語誤り率4.39%
音声認識 Transformers 英語
W
Tejveer12
25
2
Quran Whisper Base Fine Tune
Apache-2.0
このモデルは、openai/whisper-baseをquran-ayat-speech-to-textデータセットでファインチューニングしたアラビア語音声認識モデルで、コーラン経文の音声から文字への変換タスクに特化しています。
音声認識 Transformers アラビア語
Q
Baselhany
35
1
Whisper Large V3 Turbo STT Zeroth KO V2
Whisper Large v3 Turboを基に最適化された韓国語自動音声認識モデルで、高精度かつタイムスタンプ付きの書き起こし結果を提供
音声認識 Transformers 韓国語
W
o0dimplz0o
662
3
Chunkformer Large Vie
ChunkFormerアーキテクチャに基づく大規模ベトナム語自動音声認識モデルで、約3000時間のベトナム語公開音声データで微調整され、優れた性能を発揮します。
音声認識 その他
C
khanhld
1,765
12
Whisper Finetuned Amharic
Apache-2.0
openai/whisper-smallをベースにファインチューニングしたアムハラ語音声認識モデルで、評価データセットにおける単語誤り率は2.0538%
音声認識 Transformers
W
seyyaw
57
1
Wav2vec2 Large Xls R 300m Ru
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voice_17_0データセットでファインチューニングしたロシア語自動音声認識(ASR)モデルで、単語誤り率(WER)は0.195です。
音声認識 Transformers
W
NLPVladimir
56
1
Whisper Small Tajik
Apache-2.0
OpenAI Whisper-smallをファインチューニングしたタジク語自動音声認識モデルで、Google Fleursデータセットでトレーニングされ、単語誤り率24.26%です。
音声認識 Transformers その他
W
abduaziz
25
1
Audiox South V1
Apache-2.0
AudioXはJivi AIが開発した多言語自動音声認識モデルで、特にインド南部の言語に最適化されており、タミル語、テルグ語、カンナダ語、マラヤーラム語をサポートしています。
音声認識 その他
A
jiviai
148
1
Whisper Large V3 Turbo Shqip
MIT
OpenAI Whisper Large v3 Turboをアルバニア語向けに最適化した音声認識モデルで、標準アルバニア語とゲグ方言をサポート
音声認識 Transformers その他
W
Kushtrim
143
4
Whisper Small For Quran
Apache-2.0
OpenAI Whisper-smallを微調整したコーラン音声認識モデルで、アラビア語コーラン音声用に設計されています
音声認識 Transformers アラビア語
W
areaz
26
2
Whisper Khanacademy Large V3 Turbo Tr
MIT
OpenAI Whisper-large-v3-turboモデルをトルコ語のカーンアカデミーデータセットで微調整した自動音声認識(ASR)モデル
音声認識 Transformers その他
W
ysdede
31
1
Distil Large V3.5
MIT
Distil-WhisperはOpenAI Whisper-Large-v3の知識蒸留バージョンで、大規模な擬似ラベル訓練により高効率な音声認識を実現。
音声認識 Transformers 英語
D
distil-whisper
4,804
25
Whisper Tiny German 1224
Apache-2.0
Whisperアーキテクチャを基に最適化されたドイツ語音声認識モデル、パラメータ数3900万、効率的なドイツ語音声転写をサポート
音声認識 Transformers ドイツ語
W
primeline
322
9
Whisper Large V3 Turbo Common Voice 19 0 Zh TW
MIT
OpenAI Whisper-large-v3-turboをファインチューニングした繁体字中国語(台湾)自動音声認識モデル
音声認識 Transformers 中国語
W
JacobLinCool
220
4
Pathumma Whisper Th Large V3
Apache-2.0
Pathumma Whisper Large V3 はOpenAI Whisperアーキテクチャに基づくタイ語自動音声認識モデルで、タイ語と英語の音声文字起こしタスクをサポートします。
音声認識 Transformers 複数言語対応
P
nectec
352
4
Whisper Large V3 Lv Late Cv19
Apache-2.0
whisper-large-v3をファインチューニングしたラトビア語自動音声認識モデルで、AiLab.lvによって訓練され、ラトビア語音声からテキストへの変換タスクをサポートします。
音声認識 その他
W
AiLab-IMCS-UL
162
1
Whisper Large V3 Turbo Es
MIT
Whisper-large-v3-turboをファインチューニングしたスペイン語音声認識モデル。Common Voice 17.0スペイン語データセットで単語誤り率を5.34%まで低減
音声認識 Transformers スペイン語
W
adriszmar
52
4
Whisper Large V3 Turbo Arabic
Apache-2.0
transformersライブラリに基づき、common_voice_11_0データセットでopenai/whisper-large-v3-turboを微調整したバージョンで、アラビア語音声認識に特化して最適化されています。
音声認識 Transformers
W
mboushaba
1,696
1
Finetuned Whisper Mr
Apache-2.0
simran14/mr-model-hを基に、Common Voice 17.0マラーティー語データセットでファインチューニングされたWhisper小型音声認識モデル
音声認識 Transformers その他
F
simran14
38
1
Whisper Small Kurdish Sorani 10
Apache-2.0
openai/whisper-smallをファインチューニングしたクルド語ソラニ方言音声認識モデル
音声認識 Transformers
W
roshna-omer
95
1
Monsoon Whisper Medium Gigaspeech2
Apache-2.0
Monsoon-Whisper-Medium-GigaSpeech2は、タイ語自動音声認識(ASR)モデルで、Whisper-Mediumを基にGigaSpeech2データセットで微調整されており、実世界の音声認識に適しています。
音声認識 Transformers
M
scb10x
546
5
W2V2 BERT Withlm Malayalam
MIT
facebook/w2v-bert-2.0をベースにファインチューニングしたマラヤーラム語自動音声認識モデルで、複数のマラヤーラム語データセットで訓練され、KENLMライブラリで訓練された3-gram言語モデルを使用しています。
音声認識 Transformers その他
W
vrclc
65
3
Faster Whisper Large V3 French Distil Dec16
MIT
Whisper-Large-V3のフランス語蒸留バージョン、デコーダ層数を減らすことで推論効率を最適化しつつ良好な性能を維持
音声認識 Transformers フランス語
F
brandenkmurray
25
3
Whisper Large V3 Az
Apache-2.0
このモデルはOpenAIのWhisper Large v3をアゼルバイジャン語のCommon Voice 17.0データセットでファインチューニングした自動音声認識(ASR)モデルで、1.195%の単語誤り率(WER)を達成しました。
音声認識 Transformers その他
W
nsalahaddinov
96
1
Whisper Large V2 Atcosim Corpus
Apache-2.0
このモデルはopenai/whisper-large-v2をファインチューニングした音声認識モデルで、特定領域データセットで4.6858の単語誤り率を達成しました。
音声認識 Transformers
W
daisyyedda
16
2
Whisper Large V3 Russian
OpenAI Whisper-large-v3をファインチューニングしたロシア語音声認識モデルで、ロシア語認識性能を最適化
音声認識 Transformers その他
W
antony66
6,665
60
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase