# 多言語ASR

Erax WoW Turbo V1.1 CT2
MIT
CTranslate2で最適化されたWhisper Large-v3 Turboのベトナム語強化ローカライズ版で、多言語音声認識をサポートし、高速で高精度
音声認識 Transformers その他
E
erax-ai
1,283
7
Erax WoW Turbo V1.0
MIT
ベトナム語に最適化されたWhisper Large-v3 Turbo音声認識モデルで、多言語リアルタイム書き起こしをサポート
音声認識 Transformers その他
E
erax-ai
655
49
Lite Whisper Large V3 Turbo
Apache-2.0
Lite-WhisperはLiteASR技術で圧縮されたOpenAI Whisperの軽量版で、高い精度を維持しながらモデルサイズを大幅に削減しています。
音声認識 Transformers
L
efficient-speech
516
8
Whisper Small Tajik
Apache-2.0
OpenAI Whisper-smallをファインチューニングしたタジク語自動音声認識モデルで、Google Fleursデータセットでトレーニングされ、単語誤り率24.26%です。
音声認識 Transformers その他
W
abduaziz
25
1
Whisperkit Coreml
WhisperKitはAppleチップ向けに設計されたローカル音声認識フレームワークで、効率的な自動音声認識機能を提供します。
音声認識 その他
W
do-not-use-this-account-token
1,044
2
Whosper Large V2
Apache-2.0
Whosper-large-v2は、セネガルの主要言語であるウォロフ語に特化した最先端の音声認識モデルで、OpenAIのWhisper-large-v2を基に構築されており、単語誤り率(WER)と文字誤り率(CER)を大幅に改善しています。
音声認識 複数言語対応
W
CAYTU
449
6
Whisperkit Pro
その他
WhisperKit ProはWhisperKitの商用版で、自動音声認識(ASR)タスクに特化し、量子化技術をサポートし、効率的な音声処理に適しています。
音声認識
W
argmaxinc
1,862
14
Crisperwhisper
CrisperWhisperはOpenAI Whisperの高度なバリアントで、迅速かつ正確な逐語的な音声認識のために設計されており、正確(明確)な単語レベルのタイムスタンプを提供します。
音声認識 Transformers 複数言語対応
C
nyrahealth
10.23k
275
Whisperkit Coreml
WhisperKit は Apple Silicon 向けのローカル音声認識フレームワークで、効率的な自動音声認識タスクをサポートします。
音声認識 その他
W
argmaxinc
296.02k
126
Whisper Large V2 Onnx Int4 Inc
Apache-2.0
Whisperは事前学習済みの自動音声認識(ASR)および音声翻訳モデルで、68万時間の注釈付きデータでトレーニングされ、強力な汎化能力を示しています。このリポジトリには、ONNX形式のWhisper large v2モデルのINT4重みのみ量子化バージョンが含まれています。
音声認識 Transformers
W
Intel
19
27
Whisper Medium Catalan
Apache-2.0
これはOpenAI Whisper Mediumモデルをカタルーニャ語Common Voice 11.0データセットで微調整した音声認識モデルです。
音声認識 Transformers その他
W
shields
19
2
Wav2vec2 Large Xls R 300m Hausa
Apache-2.0
これは、facebook/wav2vec2 - xls - r - 300mをハウサ語音声データセットでファインチューニングした自動音声認識モデルです。
音声認識 Transformers その他
W
infinitejoy
22
1
Wav2vec2 Large Xls R 300m Guarani Small
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングしたバージョンで、グアラニー語音声認識をサポートしています。
音声認識 Transformers
W
jhonparra18
20
0
Wav2vec2 Large Xls R 300m Lithuanian
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをリトアニア語のCommon Voice 7.0データセットで微調整した自動音声認識(ASR)モデルです。
音声認識 Transformers その他
W
infinitejoy
52
0
Wav2vec2 Xls R 300m Hi Final
Apache-2.0
facebook/wav2vec2-xls-r-300mをファインチューニングしたヒンディー語音声認識モデルで、Openslr多言語コーパスとCommon Voice 7.0データセットでトレーニング
音声認識 Transformers その他
W
LegolasTheElf
14
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase