Whisper Small Ta
Apache-2.0
このモデルは、OpenAIのWhisper Smallをタミル語のCommon Voice 17.0データセットでファインチューニングした音声認識モデルで、単語誤り率(WER)は43.23%です。
音声認識
Transformers その他

W
navin-kumar-j
38
1
Whisper Fa Tinyyy
MIT
OpenAI Whisper-tinyをファインチューニングしたペルシャ語自動音声認識モデル、common_voice_11_0データセットでトレーニング
音声認識
Transformers その他

W
hackergeek98
55
2
Mms 300m Arabic Dialect Identifier
このモデルはMMS-300mをファインチューニングしたアラビア語方言音声認識モデルで、現代標準アラビア語および4つの主要なアラビア語方言を識別できます。
音声分類
Transformers アラビア語

M
badrex
73
2
My Frugal Audio Model
Apache-2.0
これはfacebook/wav2vec2-baseをファインチューニングした音声処理モデルで、主に音声関連タスクに使用されます
音声分類
Transformers

M
hsalehILB
1
0
Xls R Greek Cretan
クレタ方言向け初の自動音声認識(ASR)モデルで、ギリシャ語XLS-Rモデルをファインチューニングして訓練されました。
音声認識
Transformers

X
ilsp
17
1
Arabic Alphabet Speech Classification
これはアラビア文字の発音を認識・分類するtransformersモデルです。
音声分類
Transformers

A
HamzaSidhu786
60
1
Whisper Large V3 Taiwanese Hakka
Whisper-large-v3をファインチューニングした台湾客家語音声認識モデルで、複数の客家語方言をサポート
音声認識
Transformers その他

W
formospeech
41
5
Wav2vec2 Large Xls R 300m Albanian Colab
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-300mをcommon_voice_albanianデータセットで微調整した音声処理モデルで、アルバニア語関連のタスクに適しています。
音声認識
Transformers

W
Alimzhan
8,810
1
Viet Tones Model
wav2vec2-base-vietnamese-250hをファインチューニングしたベトナム語声調識別モデル、精度59.72%
音声認識
Transformers

V
StevenLe456
22
0
Vegam Whisper Medium Ml
MIT
これはthennal/whisper-medium-mlをCTranslate2モデル形式に変換したバージョンで、マラヤーラム語音声認識に使用されます
音声認識 その他
V
smcproject
83
5
Exp W2v2t Th Hubert S533
Apache-2.0
facebook/hubert-large-ll60kをベースにファインチューニングしたタイ語音声認識モデル、トレーニングデータはCommon Voice 7.0から取得
音声認識
Transformers その他

E
jonatasgrosman
19
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V3
Apache-2.0
wav2vec2-large-xlsr-53ベースの自動音声認識モデルで、GARY109/AI_LIGHT_DANCEデータセットでファインチューニング済み
音声認識
Transformers

A
gary109
191
0
Asr Wav2vec2 Dvoice Amharic
Apache-2.0
これはアムハラ語向けの自動音声認識モデルで、wav2vec 2.0アーキテクチャとCTC/Attentionメカニズムを使用してトレーニングされています
音声認識 その他
A
speechbrain
96
9
Wav2vec2 Xls R 300m Mrbrown Finetune1
Apache-2.0
facebook/wav2vec2-xls-r-300m事前学習モデルをベースに、uob_singlishデータセットで微調整した音声認識モデル
音声認識
Transformers

W
RuiqianLi
18
0
Malaya Speech Mrbrown Finetune1
このモデルはuob_singlishデータセットを使用してwav2vec2-xls-r-300m-mixedを微調整したバージョンで、シンガポール英語音声認識に特化しています。
音声認識
Transformers

M
RuiqianLi
24
0
One Simple Finetune Test
Apache-2.0
このモデルはli_singlishデータセットを使用してRuiqianLi/wav2vec2-large-xls-r-300m-singlish-colabをファインチューニングしたバージョンで、主にシンガポール英語音声認識タスクに使用されます。
音声認識
Transformers

O
RuiqianLi
28
0
FYP ARABIZI
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53を未知のデータセットでファインチューニングした音声認識モデルで、アラビア語方言(Arabizi)の認識をサポートします。
音声認識
Transformers

F
ali-issa
33
1
Speech Processing Project Wav2vec2
Apache-2.0
このモデルはkingabzpro/wav2vec2-urduをファインチューニングした音声処理モデルで、特定の音声認識タスクに適しています。
音声認識
Transformers

S
Raffay
21
0
Filipino Wav2vec2 L Xls R 300m Test
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをfilipino_voiceデータセットでファインチューニングした音声認識モデルで、フィリピン語をサポートしています。
音声認識
Transformers

F
Khalsuu
5,738
0
Wav2vec2 Large 100h Lv60 Self
Apache-2.0
Wav2Vec2-Large-100h-Lv60は、100時間のLibri-LightとLibrispeech音声データを用いて事前学習と微調整を行った大規模モデルで、自己訓練目標で訓練されており、16kHzサンプリングレートの音声認識タスクに適しています。
音声認識
Transformers 英語

W
Splend1dchan
17
0
Wav2vec2 Common Voice Tr Demo
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をトルコ語Common Voiceデータセットでファインチューニングした音声認識モデルです
音声認識
Transformers その他

W
YiTian
30
0
Wav2vec2 Large Xlsr Turkish
Apache-2.0
facebook/wav2vec2-large-xlsr-53をトルコ語Common Voiceデータセットでファインチューニングした音声認識モデル
音声認識 その他
W
m3hrdadfi
384
7
Xls R Ab Test
このモデルはCommon Voice 7.0 ABデータセットで微調整された自動音声認識モデルで、XLS - Rダミーアーキテクチャに基づいています。
音声認識
Transformers その他

X
cahya
20
0
HIYACCENT Wav2Vec2
HIYACCENTはナイジェリア英語アクセントに最適化された音声認識システムで、Wav2Vec2アーキテクチャを改良し、認識性能を20%以上向上させました。
音声認識
Transformers

H
codeceejay
27
1
Wav2vec2 XLS R 300m Konkani
facebook/wav2vec2-xls-r-300mをプライベートデータセットでファインチューニングした自動音声認識モデルで、ロバストな音声イベント処理能力を備えています。
音声認識
Transformers

W
StephennFernandes
74
0
Wav2vec2 Large Xlsr Tamil Commonvoice
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceタミル語データセットでファインチューニングした音声認識モデルです
音声認識
Transformers

W
nikhil6041
43
0
Wav2vec2 Large Xlsr 53 Ir
Apache-2.0
wav2vec2-large-xlsr-53を微調整したアイルランド・ゲール語自動音声識別モデルで、Common Voice 7.0データセットで訓練されました。
音声認識
Transformers

W
jcmc
24
0
Wav2vec2 Large Xlsr Upper Sorbian Mixed
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53をファインチューニングした上ソルブ語音声認識モデルで、トレーニングデータはCommon Voiceデータセットとオンラインソルブ語コースから取得されています。
音声認識 その他
W
jimregan
25
0
Wav2vec2 Large Xlsr 53 Hungarian
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルを微調整したハンガリー語自動音声認識モデルで、一般音声データセットを使用して訓練されています。
音声認識 その他
W
anton-l
17
0
Wav2vec2 Xls R 300m W2V2 XLSR 300M YAKUT SMALL
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをヤクート語(サハ語)音声データセットで微調整した音声認識モデルです。
音声認識
Transformers その他

W
emre
90
0
Distilhubert
Apache-2.0
DistilHuBERTは、HuBERTモデルを階層的に蒸留することで実現された軽量版の音声表現学習モデルで、性能を維持しながらモデルサイズと計算コストを大幅に削減します。
音声認識
Transformers 英語

D
ntu-spml
2,962
31
Wavlm VLSP Vi
microsoft/wavlm-base-plusをベースに、PHONGDTD/VINDATAVLSP - NAデータセットで微調整したベトナム語自動音声認識モデル
音声認識
Transformers

W
phongdtd
21
0
Sew D Small 100k Ft Timit
Apache-2.0
asapp/sew-d-small-100kを基にTIMIT_ASRデータセットで微調整された自動音声認識モデル
音声認識
Transformers

S
patrickvonplaten
18
0
Wav2vec2 Xls R 300m Lg
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをCOMMON_VOICE - LGデータセットでファインチューニングした音声認識モデルで、ルガンダ語(lg)の自動音声認識タスクをサポートします。
音声認識
Transformers その他

W
samitizerxu
22
0
Wav2vec2 Base 10k 8khz Pt Cv7 2
Apache-2.0
このモデルはwav2vec2アーキテクチャに基づくポルトガル語自動音声認識モデルで、Common Voice 7データセットで微調整されており、8kHzサンプリングレートのオーディオ入力をサポートします。
音声認識
Transformers その他

W
lgris
24
2
Wav2vec2 Large Xls Ar
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルを基にファインチューニングしたアラビア語自動音声認識モデルで、Common Voiceアラビア語データセットでテストしたWERは52%です。
音声認識
Transformers アラビア語

W
mohamed1ai
30
1
Wav2vec2 Large 960h
Apache-2.0
Wav2Vec2はFacebookが開発した音声認識モデルで、自己教師あり学習により生の音声から音声表現を学習し、LibriSpeechデータセットで微調整され、高精度な音声転写を実現します。
音声認識
Transformers 英語

W
facebook
77.59k
29
Xlrs 53 Finnish
Apache-2.0
XLSR-Wav2Vec2は多言語音声認識モデルで、言語間事前学習により共有音声表現を学習し、53言語をサポートします。
音声認識 その他
X
vneralla
32
0
Wav2vec2 Large Xlsr Turkish Demo Colab
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をCommon Voiceデータセットでファインチューニングしたトルコ語音声認識モデルです
音声認識
Transformers

W
patrickvonplaten
14
2
Wav2vec2 Base 10k Voxpopuli Ft Sk
VoxPopuliコーパスの10Kの未ラベルデータで事前学習され、スロバキア語の転写データでファインチューニングされた音声認識モデル
音声認識
Transformers その他

W
facebook
39
1
- 1
- 2
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98