Whisper Large V3
Apache-2.0
WhisperはOpenAIが開発した最先端の自動音声認識(ASR)および音声翻訳モデルで、複数言語をサポート
音声認識
Safetensors 複数言語対応
W
unsloth
4,002
1
Parakeet Tdt Ctc 0.6b Ja
このモデルはFastConformerアーキテクチャに基づく日本語自動音声認識(ASR)モデルで、NVIDIAによって開発されMLXフォーマットに変換されました。
音声認識
P
mlx-community
368
1
Gigaam V2 Onnx
MIT
GigaAM v2は自動音声認識(ASR)モデルで、ロシア語音声からテキストへの変換タスクをサポートし、CTCとRNN-Tの2つのアーキテクチャを提供します。
音声認識 その他
G
istupakov
170
2
Whisper Small Tel
Apache-2.0
OpenAI Whisper-large-v2をテルグ語音声データセットでファインチューニングした音声認識モデル
音声認識
Transformers その他

W
sagarchapara
17
1
Kb Whisper Tiny
Apache-2.0
スウェーデン国立図書館が公開したWhisperモデルで、スウェーデン語音声認識に特化して最適化されており、OpenAIのオリジナル版と比べて誤り率が大幅に低下しています。
音声認識
Transformers その他

K
KBLab
1,791
2
Kb Whisper Medium
Apache-2.0
スウェーデン国立図書館が5万時間以上のスウェーデン語音声で訓練したWhisperモデルで、スウェーデン語音声認識タスクで優れた性能を発揮
音声認識
Transformers その他

K
KBLab
691
3
Whisper Small Turkish 0
Apache-2.0
OpenAI Whisper-smallをファインチューニングしたトルコ語音声認識モデル
音声認識
Transformers その他

W
ysdede
14
1
Whisper Large V3 Turbo Shqip
MIT
OpenAI Whisper Large v3 Turboをアルバニア語向けに最適化した音声認識モデルで、標準アルバニア語とゲグ方言をサポート
音声認識
Transformers その他

W
Kushtrim
143
4
Voice Clone Large Finetune Final
Apache-2.0
このモデルはopenai/whisper-large-v3を微調整した音声クローンモデルで、主に音声認識タスクに使用され、評価データセットでの単語誤り率は15.3572です。
音声認識
Transformers

V
neuronbit
37
2
Whisper Large V3 Turbo
ONNX形式で最適化されたWhisper大規模音声認識モデル、ウェブ展開向けに設計
音声認識
Transformers

W
onnx-community
2,988
54
Faster Whisper Large V3 Turbo Ct2
MIT
これはWhisper large-v3 turboモデルをCTranslate2形式に変換したバージョンで、効率的な自動音声認識タスクに使用されます。
音声認識 複数言語対応
F
deepdml
254.96k
128
Whisper Large V3 Myanmar
Apache-2.0
このモデルは、openai/whisper-large-v3をミャンマー語音声データセットで微調整した自動音声認識モデルで、ミャンマー語の音声文字起こしに特化しています。
音声認識
Transformers その他

W
chuuhtetnaing
172
1
Distil Whisper Large V3 German
Apache-2.0
distil-whisper技術に基づくドイツ語音声認識モデルで、パラメータ数は7.56億、高品質を維持しながらより高速な推論を実現。
音声認識
Transformers ドイツ語

D
primeline
207
15
Belle Whisper Large V3 Zh
Apache-2.0
whisper-large-v3を微調整して最適化した中国語音声認識モデルで、複数の中国語音声ベンチマークテストで性能が大幅に向上
音声認識
Transformers

B
BELLE-2
1,666
112
Whisper Native Elderly 9 Dutch
Apache-2.0
OpenAI Whisper Large V2モデルをオランダ語データセットで微調整した音声認識モデル、単語誤り率10.14%
音声認識
Transformers その他

W
golesheed
22
1
Nb Whisper Large
Apache-2.0
ノルウェー国立図書館が開発した自動音声認識モデルで、Whisperアーキテクチャに基づいており、ノルウェー語と英語の音声文字起こしと翻訳をサポートします。
音声認識
Transformers

N
NbAiLabBeta
776
9
Belle Whisper Large V2 Zh
Apache-2.0
whisper-large-v2を微調整した中国語音声認識モデルで、複数の中国語音声認識ベンチマークテストにおいて30-70%の相対的性能向上を実現しました。
音声認識
Transformers

B
BELLE-2
140
33
Whisper Large V3 German
Apache-2.0
Whisper Large v3を基にしたドイツ語音声認識のファインチューニングモデルで、ドイツ語音声処理と認識に最適化されています
音声認識
Transformers ドイツ語

W
primeline
8,745
70
Whisper Large V2 Ko
Apache-2.0
OpenAI Whisper-large-v2をファインチューニングした韓国語自動音声認識(ASR)モデルで、韓国語データセットで優れた性能を発揮
音声認識
Transformers 韓国語

W
byoussef
94
22
Englishspeechtotext
Apache-2.0
facebook/wav2vec2-xls-r-300mをファインチューニングした英語音声認識モデル
音声認識
Transformers

E
Foxasdf
24
1
Whisper Large V2 Hausa
Apache-2.0
このモデルはOpenAIのWhisper Large-V2をハウサ語音声認識タスク用にファインチューニングしたバージョンで、Common Voice 11.0データセットでトレーニングされています
音声認識
Transformers その他

W
DrishtiSharma
44
5
Whisper Large V2 Mix Jp
Apache-2.0
OpenAI Whisper-large-v2モデルを日本語音声データセットでファインチューニングした自動音声認識(ASR)モデル
音声認識
Transformers

W
vumichien
93
9
Whisper Large V2 Pl V2
Whisper Large v2をポーランド語データセットでファインチューニングした自動音声認識モデルで、ポーランド語音声からテキストへの変換タスクをサポートします。
音声認識
Transformers その他

W
bardsai
217
6
Whisper Large Sme
Apache-2.0
Whisper-large-v2をファインチューニングした北サーミ語音声認識モデルで、テストセットでの単語誤り率は24.91%
音声認識
Transformers その他

W
NbAiLab
40
5
Whisper Medium Jp
Apache-2.0
openai/whisper-mediumをcommon_voice_11_0データセットでファインチューニングした日本語音声認識モデル
音声認識
Transformers 日本語

W
vumichien
4,542
25
Whisper Medium
Apache-2.0
Whisperは、事前学習された自動音声認識(ASR)および音声翻訳モデルで、68万時間のアノテーション付きデータで学習され、強力なクロスドメイン汎化能力を持っています。
音声認識 複数言語対応
W
openai
394.31k
239
Assignment1 Francesco
MIT
音声からテキストへの変換器(S2T)で訓練された自動音声認識(ASR)モデルで、英語音声認識向けに設計されています
音声認識
Transformers 英語

A
Classroom-workshop
22
0
Stt Kr Conformer Transducer Large
これはConformer-Transducerアーキテクチャに基づく大規模な韓国語自動音声認識モデルで、Ksponspeechデータセットでトレーニングされ、韓国語音声の文字起こしタスクに適しています。
音声認識 その他
S
eesungkim
129
9
Wav2vec2 Xls R 300m Ur Cv9 With Lm
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをウルドゥー語音声データセットでファインチューニングした自動音声認識(ASR)モデルです
音声認識
Transformers その他

W
anuragshas
18
1
Wav2vec2 Russian
wav2vec2アーキテクチャに基づくロシア語音声認識モデル。認識結果は対応するテキスト誤り訂正ネットワークで後処理可能
音声認識
Transformers

W
UrukHan
100
8
ASCEND Dataset Model
Apache-2.0
facebook/wav2vec2-xls-r-300mをファインチューニングした音声認識モデルで、ASCENDデータセットで学習
音声認識
Transformers

A
GleamEyeBeast
22
0
Wav2vec2 Large Xls R 300m Assamese Cv8
Apache-2.0
これはfacebook/wav2vec2 - xls - r - 300mモデルをアッサム語データセットで微調整した自動音声認識(ASR)モデルです。
音声認識
Transformers その他

W
infinitejoy
18
0
Wav2vec2 Base 10k Voxpopuli Ft Hr
Facebook Wav2Vec2アーキテクチャに基づく音声認識モデルで、VoxPopuliコーパスで事前学習されクロアチア語データでファインチューニングされています
音声認識
Transformers その他

W
facebook
20
0
Wav2vec2 Urdu Stt
これはWav2Vec2アーキテクチャに基づくウルドゥー語音声認識モデルで、ウルドゥー語音声をテキストに変換できます。
音声認識
Transformers

W
addy88
145
0
Wav2vec2 Punjabi Stt
これはWav2Vec2アーキテクチャに基づくパンジャーブ語音声認識モデルで、パンジャーブ語音声をテキストに変換できます。
音声認識
Transformers

W
addy88
17
1
Wav2vec2 Base Libir Zenodo
Apache-2.0
このモデルはfacebook/wav2vec2-base-960hを未知のデータセットでファインチューニングした音声認識モデルで、主に自動音声認識タスクに使用されます。
音声認識
Transformers

W
samantharhay
25
0
S2t Medium Librispeech Asr
MIT
シーケンスツーシーケンストランスフォーマーアーキテクチャに基づく、自動音声認識(ASR)用の音声からテキストへの変換器(S2T)モデル
音声認識
Transformers 英語

S
facebook
1,086
9
Wav2vec2 Base 10k Voxpopuli Ft Nl
Facebook Wav2Vec2アーキテクチャに基づく音声認識モデルで、VoxPopuliコーパスの10K時間の未ラベルオランダ語データで事前学習され、オランダ語文字起こしデータでファインチューニングされています。
音声認識
Transformers その他

W
facebook
28
0
Wav2vec2 Gpt2 Wandb Grid Search
LibriSpeechデータセットに基づいて訓練された自動音声認識(ASR)モデル
音声認識
Transformers

W
sanchit-gandhi
13
0
Wav2vec2 Large Xls R 300m Hi CV7
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをヒンディー語Common Voice 7.0データセットでファインチューニングした自動音声認識モデルです。
音声認識
Transformers その他

W
DrishtiSharma
46
0
- 1
- 2
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98