# 高精度書き起こし

Stt Ru Fastconformer Hybrid Large Pc Onnx
NVIDIA FastConformer-Hybrid Large は、FastConformer アーキテクチャに基づくロシア語自動音声認識モデルで、CTC と RNN-T デコーダーをサポートしています。
音声認識
S
istupakov
163
1
Whisper Custom Small
Apache-2.0
OpenAI Whisper アーキテクチャに基づく小型音声認識モデルで、英語音声からテキストへの変換タスクに特化しています。
音声認識 英語
W
gyrroa
15
1
Whisper Large V3 Turbo Russian
MIT
OpenAI Whisper Large V3 Turboを基に最適化したロシア語自動音声認識(ASR)モデル、Mozilla Common Voice 17ロシア語データセットでファインチューニング
音声認識 Transformers その他
W
dvislobokov
1,022
12
Belle Whisper Large V3 Turbo Zh
Apache-2.0
whisper-large-v3-turboを基に中国語音声認識向けに微調整したモデルで、複数の中国語音声認識ベンチマークテストで性能が大幅に向上
音声認識 Transformers
B
BELLE-2
2,891
55
Uzbek Stt 3
Apache-2.0
Oyqiz/uzbek_sttをベースにファインチューニングしたウズベク語音声認識モデルで、特に法律と軍事分野のデータに最適化されています
音声認識 Transformers その他
U
sarahai
157
3
Whisper Large V3 Gguf
Apache-2.0
Whisperは多言語自動音声認識(ASR)システムで、複数の言語の音声をテキストに変換するタスクをサポートしています。
音声認識 複数言語対応
W
vonjack
931
14
Whisper Large V3 Ru Podlodka
Apache-2.0
これはWhisper Large V3をベースにしたロシア語音声認識モデルで、ロシア語音声に特化して最適化されています。
音声認識 Transformers その他
W
bond005
570
8
Faster Whisper Large V3 Ja
MIT
OpenAI Whisper large-v3をベースにした日本語最適化バージョン、多言語音声認識をサポート
音声認識 複数言語対応
F
JhonVanced
46
3
Faster Whisper Large V3
MIT
Whisper large-v3はOpenAIが開発した大規模多言語自動音声認識(ASR)モデルで、複数言語の音声からテキストへの変換タスクをサポートしています。
音声認識 複数言語対応
F
Systran
713.48k
376
Wav2vec2 Base 960h
Facebookのwav2vec2-base-960hモデルをONNX形式に変換したバージョンで、Transformers.js向けに設計されており、ブラウザ上での音声認識をサポート
音声認識 Transformers
W
Xenova
117
3
Wav2vec2 Large Xlsr 53 English
wav2vec 2.0アーキテクチャに基づく大規模音声認識モデルで、英語音声をテキストに変換可能
音声認識 Transformers
W
Xenova
14
2
Faster Whisper Large V2 Mix Jp
これはwhisper-large-v2-mix-jpモデルのCTranslate2変換バージョンで、日本語音声認識タスクに適しています
音声認識 日本語
F
arc-r
64
9
Faster Whisper Large V2 Japanese 5k Steps
MIT
Whisper Large V2モデルに基づく日本語自動音声認識(ASR)モデルで、CTranslate2で最適化変換され、効率的な推論をサポートします。
音声認識 Transformers 日本語
F
zh-plus
280
18
Wav2vec2 Nepali
Facebookのwav2vec2モデルをファインチューニングしたネパール語音声認識モデル
音声認識 Transformers その他
W
anish-shilpakar
312
1
Faster Whisper Large V2
MIT
これはOpenAI Whisper large-v2モデルのCTranslate2変換バージョンで、効率的な音声認識に使用されます
音声認識 複数言語対応
F
guillaumekln
161.19k
199
Icefall Asr Gigaspeech Conformer Ctc
Icefallはk2フレームワークに基づく自動音声認識(ASR)ツールキットで、効率的で柔軟な音声認識モデルのトレーニングと推論に焦点を当てています。
音声認識 英語
I
speechcolab
0
0
Wav2vec2 Bjorn
wav2vec 2.0は自己教師あり学習の音声認識モデルで、大量の未ラベル音声データで事前学習され、効率的に音声をテキストに変換できます。
音声認識 Transformers
W
sharpcoder
40
0
Xls R 300m Sv Robust
これはKBLab/wav2vec2-large-voxrexを基に、スウェーデン語Common Voiceデータセットでファインチューニングした自動音声認識モデルです
音声認識 Transformers その他
X
marinone94
27
1
Wav2vec2 Large Xls R 300m Hindi
Apache-2.0
これはFacebookのwav2vec2-xls-r-300mモデルをヒンディー語音声データセットでファインチューニングした自動音声認識(ASR)モデルです
音声認識 Transformers その他
W
infinitejoy
13
0
Wav2vec2 Tamil Stt
これはWav2Vec2アーキテクチャに基づくタミル語音声認識モデルで、タミル語音声をテキストに変換できます。
音声認識 Transformers
W
addy88
63
0
Wav2vec2 Xlsr Korean Senior
Apache-2.0
wav2vec2-xlsrアーキテクチャに基づく韓国語自動音声認識モデルで、韓国の高齢者音声に特化して最適化されています
音声認識 Transformers その他
W
hyyoka
26
0
Wav2vec2 Gujarati Stt
これはWav2Vec2アーキテクチャに基づくグジャラート語音声認識モデルで、グジャラート語音声を直接テキストに変換します。
音声認識 Transformers
W
addy88
18
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase