Distil Whisper Large V3 Ptbr
MIT
これはdistil-whisper-large-v3の微調整バージョンで、ブラジルポルトガル語の自動音声認識(ASR)に特化しており、Common Voice 16データセットと私有データセットを組み合わせて訓練されています。
音声認識
Safetensors
D
freds0
580
5
Ascend With English
timit_asrデータセットを使用してascendモデルをファインチューニングした英語音声認識モデル
音声認識
Transformers

A
GleamEyeBeast
23
0
Xls R 300m Sv Robust
これはKBLab/wav2vec2-large-voxrexを基に、スウェーデン語Common Voiceデータセットでファインチューニングした自動音声認識モデルです
音声認識
Transformers その他

X
marinone94
27
1
Wav2vec2 Large Xlsr Mr 2
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルを基に、マラーティー語でファインチューニングした自動音声認識(ASR)モデルで、InterSpeech 2021マラーティー語データセットの一部を使用してトレーニングされました。
音声認識 その他
W
gchhablani
13
0
Unispeech Large 1500h Cv Timit
このモデルはmicrosoft/unispeech-large-1500h-cvをTIMIT_ASRデータセットでファインチューニングした自動音声認識モデルで、評価セットで21.96%の単語誤り率(WER)を達成しました。
音声認識
Transformers

U
patrickvonplaten
536
0
Xlsr Indonesia
Apache-2.0
XLSRアーキテクチャを基にファインチューニングしたインドネシア語自動音声認識(ASR)モデル、Common Voiceインドネシア語データセットでトレーニング
音声認識
Transformers その他

X
acul3
23
0
Wav2vec2 Large Xlsr 53 Eu
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルを基に、Common Voiceデータセットでバスク語にファインチューニングした音声認識モデルです。
音声認識
Transformers

W
enterprise-explorers
2,758
0
Xls R 300m It Phoneme
facebook/wav2vec2-xls-r-300mをイタリア語データセットでファインチューニングした音声認識モデル
音声認識
Transformers

X
patrickvonplaten
17
1
Bp500 Base10k Voxpopuli
Apache-2.0
これはブラジルポルトガル語に最適化されたWav2vec 2.0音声認識モデルで、複数のブラジルポルトガル語データセットでファインチューニングされています
音声認識
Transformers その他

B
lgris
23
0
Wav2vec2 Large Xlsr Indonesian
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースに微調整されたインドネシア語自動音声認識モデルで、Common Voiceインドネシア語データセットで訓練され、テストのWERは25.86%です。
音声認識 その他
W
cahya
74
0
Wav2vec2 Large Xlsr Gl
Facebookのwav2vec2-large-xlsr-53モデルをファインチューニングしたガリシア語自動音声認識(ASR)モデルで、OpenSLR 77データセットで16.79%のWERを達成
音声認識
W
diego-fustes
2,264
0
Xls R 300m Es
Apache-2.0
スペイン語Common Voiceデータセットでファインチューニングされた音声認識モデル。facebook/wav2vec2-xls-r-300mアーキテクチャ採用。テストセットでWER14.6%を達成
音声認識
Transformers スペイン語

X
polodealvarado
23
4
Wav2vec2 Large Xlsr 53 Turkish
Apache-2.0
これはFacebookのwav2vec2-large-xlsr-53モデルをトルコ語Common Voiceデータセットでファインチューニングした自動音声認識モデルです。
音声認識 その他
W
dundar
23
1
Hindi Base Wav2vec2
Apache-2.0
これはwav2vec2アーキテクチャに基づくヒンディー語の自動音声認識(ASR)モデルで、Common Voiceなどのデータセットで訓練されています。
音声認識
Transformers その他

H
Harveenchadha
49
2
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98