# 低リソース音声認識

Whisper Akan Finetuned
Whisperアーキテクチャに基づく自動音声認識モデルで、特定の言語や方言に対して微調整されています
音声認識 Transformers
W
dennis-9
68
1
Kinyawhisper
MIT
KinyaWhisperはOpenAI Whisperモデルをファインチューニングしたルワンダ語自動音声認識(ASR)システムで、低リソースの先住民言語向けに設計されています。
音声認識 Transformers その他
K
benax-rw
149
3
Wav2vec2 Large Mms 1b Wolof
MIT
このモデルはfacebook/mms-1b-allをIsma/alffa_wolofデータセットでファインチューニングしたバージョンで、ウォロフ語の自動音声認識(ASR)タスク専用に設計されています。
音声認識 Safetensors その他
W
bilalfaye
50
1
Xlsr 53 Bemba 5hrs
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングした音声認識モデルで、Bemba語をサポート
音声認識 Transformers
X
csikasote
25
0
Wav2vec2 Large 10min Lv60 Self
Apache-2.0
このモデルはWav2Vec2アーキテクチャに基づく大規模音声認識モデルで、Libri-LightとLibrispeechの10分間データで事前学習と微調整が行われ、自己学習目標を使用してトレーニングされました。16kHzサンプリングレートの音声オーディオに適しています。
音声認識 Transformers 英語
W
Splend1dchan
177
0
Xls R Ta
Apache-2.0
facebook/wav2vec2-xls-r-300mをタミル語データセットでファインチューニングした自動音声認識モデル
音声認識 Transformers その他
X
jejomi
22
0
Wav2vec2 Xls R 300m Bas CV8 V2
Apache-2.0
facebook/wav2vec2-xls-r-300mをベースにCommon Voice 8データセットでファインチューニングされた自動音声認識モデルで、バスク語(bas)をサポートします。
音声認識 Transformers その他
W
emre
18
0
Asr Hubert Cluster Bart Base
Apache-2.0
HubertとBARTアーキテクチャに基づく自動音声認識モデルで、クラスタリング特徴変換を通じて音声からテキストへの変換を実現します。
音声認識 Transformers 複数言語対応
A
voidful
13
0
Wav2vec2 Large Xlsr Egyptian
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたエジプトアラビア語自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 Transformers その他
W
othrif
19
0
Wav2vec2 Large Xlsr 53 Rm Vallader
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルを微調整したロマンシュ語ヴァラディエル方言の音声認識モデルで、単語誤り率は32.89%です。
音声認識
W
anuragshas
58
0
Unispeech 1350 En 90 It Ft 1h
UniSpeechは、教師あり音素CTC学習と自己教師あり学習を組み合わせた統一音声表現学習モデルで、特にイタリア語向けにファインチューニングされています。
音声認識 Transformers その他
U
microsoft
19
0
Wav2vec2 Xls R 1b Hi Cv8
Apache-2.0
これはfacebook/wav2vec2-xls-r-1bモデルをCommon Voice 8.0ヒンディー語データセットでファインチューニングした自動音声認識モデルで、ヒンディー語の音声をテキストに変換するタスクをサポートします。
音声認識 Transformers その他
W
anuragshas
16
0
Wav2vec2 Base 100h
Apache-2.0
Wav2Vec2基礎版は、16kHzサンプリングのLibrispeech音声オーディオで100時間の事前学習と微調整を行った自動音声認識モデルです。
音声認識 Transformers 英語
W
facebook
4,380
6
Wav2vec Test
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングしたエジプトアラビア語自動音声認識モデルで、arabicspeech.org MGB-3データセットでトレーニングされています。
音声認識 Transformers アラビア語
W
othrif
27
0
Wav2vec2 Large Xlsr Rm Sursilv
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルを基にファインチューニングした自動音声認識モデルで、ロマンシュ語のスルシルヴァ方言を識別するために特別に設計されています。
音声認識
W
gchhablani
27
0
Xls R 300m Ur Cv7
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-300mをMOZILLA - FOUNDATION/COMMON_VOICE_7_0 - URデータセットで微調整したウルドゥー語自動音声認識(ASR)モデルです。
音声認識 Transformers その他
X
HarrisDePerceptron
19
0
Xls R 300m Ur
Apache-2.0
これはXLS - Rアーキテクチャに基づき、Common Voice 8.0ウルドゥー語データセットで微調整された自動音声認識モデルで、単語誤り率(WER)は47.38です。
音声認識 Transformers その他
X
HarrisDePerceptron
19
0
Xlsr Large 53 Ur
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53をベースに、Common Voice 8.0ウルドゥー語データセットで微調整された自動音声認識モデルです。
音声認識 Transformers その他
X
HarrisDePerceptron
14
0
Wav2vec2 Xls R 60 Urdu
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をCommon Voiceウルドゥー語データセットでファインチューニングした自動音声認識モデルです
音声認識 Transformers その他
W
Maniac
16
1
Xls R 1b Ur
Apache-2.0
Facebookのwav2vec2-xls-r-1bモデルをファインチューニングしたウルドゥー語自動音声認識(ASR)モデルで、Common Voice 8.0ウルドゥー語データセットでトレーニングされています
音声認識 Transformers その他
X
HarrisDePerceptron
21
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase