Whisper Large V3 Cantonese
Apache-2.0
Whisper v3を微調整した広東語自動音声認識モデル、Common Voice 17データセットで訓練
音声認識
Transformers その他

W
khleeloo
25
4
Distil Whisper Small Cantonese
Apache-2.0
これはWhisper Smallをベースにした広東語音声認識蒸留モデルで、Common Voice 16.0で9.7のCER(句読点なし)を達成しました。
音声認識
Transformers 中国語

D
alvanlii
187
7
Whisper Large V2 Cantonese
Apache-2.0
OpenAI Whisper Large V2モデルを微調整した広東語自動音声認識(ASR)モデルで、Common Voice 11.0広東語データセットで訓練され、文字誤り率(CER)は6.21%です。
音声認識
Transformers その他

W
Scrya
210
7
Whisper Large V2 Cantonese
Apache-2.0
OpenAI Whisper Large V2を広東語データセットでファインチューニングした自動音声認識モデルで、テストセットで6.7274%の文字誤り率を達成
音声認識
Transformers その他

W
simonl0909
131
12
Whisper Small Cantonese
Apache-2.0
OpenAI Whisper-smallをファインチューニングした広東語音声認識モデル、Common Voice 16.0テストセットでCER7.93を達成
音声認識
Transformers 複数言語対応

W
alvanlii
2,413
85
Wav2vec2 Large Xlsr 53 Cantonese
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベースに、Common Voiceコーパス8.0版で広東語にファインチューニングした音声認識モデル
音声認識
Transformers その他

W
CAiRE
1,214
3
Wav2vec2 Large Xlsr Cantonese
Apache-2.0
Facebookのwav2vec2-large-xlsr-53モデルをファインチューニングした広東語音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。
音声認識 その他
W
ctl
1,010
12
Wav2vec2 Large Xls R 300m Cantonese
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルを広東語(香港)データセットでファインチューニングした自動音声認識(ASR)モデルで、広東語音声認識タスク専用に設計されています。
音声認識
Transformers 中国語

W
ivanlau
42
1
Wav2vec2 Xls R 300m Zh HK V2
Apache-2.0
XLS-Rアーキテクチャに基づく広東語自動音声認識モデル、Common Voice広東語データセットでファインチューニング
音声認識
Transformers

W
w11wo
23
0
Wav2vec2 Large Xlsr 53 Hk
Apache-2.0
facebook/wav2vec2-large-xlsr-53を広東語(Common Voiceデータセット使用)でファインチューニングした音声認識モデル
音声認識
Transformers

W
voidful
26
2
Wav2vec2 Xls R 300m Zh HK Lm V2
Apache-2.0
XLS-Rアーキテクチャに基づく自動音声認識モデルで、広東語(zh-HK)向けに最適化され、Common Voiceデータセットで微調整され、5-gram言語モデルが追加されています。
音声認識
Transformers

W
w11wo
25
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98