# 高精度音声文字起こし

Distil Whisper Large V3 Ptbr
MIT
これはdistil-whisper-large-v3の微調整バージョンで、ブラジルポルトガル語の自動音声認識(ASR)に特化しており、Common Voice 16データセットと私有データセットを組み合わせて訓練されています。
音声認識 Safetensors
D
freds0
580
5
Reverb Asr
その他
RevのReverb ASRモデルは20万時間の専門家による手作業で転記された英語音声データでトレーニングされており、現在最も正確なオープンソース英語自動音声認識システムの一つです。
音声認識 英語
R
Revai
17
84
Exp W2v2t It Wavlm S895
Apache-2.0
microsoft/wavlm-largeモデルを基にファインチューニングしたイタリア語自動音声認識モデルで、Common Voice 7.0イタリア語データセットでトレーニングされています。
音声認識 Transformers その他
E
jonatasgrosman
42
0
Ai Light Dance Stepmania Ft Wav2vec2 Large Xlsr 53 V3
Apache-2.0
wav2vec2-large-xlsr-53ベースの自動音声認識モデルで、GARY109/AI_LIGHT_DANCEデータセットでファインチューニング済み
音声認識 Transformers
A
gary109
191
0
Wav2vec2 2 Bert Large No Adapter Frozen Enc
このモデルはlibrispeech_asrデータセットを使って学習された音声認識モデルで、評価セットで2.0133の単語誤り率(WER)を達成しました。
音声認識 Transformers
W
speech-seq2seq
25
2
Wav2vec2 Xls R 300m Turkish Tr Med
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-300mを一般的な音声データセットで微調整したトルコ語音声認識モデルです。
音声認識 Transformers
W
emre
22
0
Wav2vec2 Large Xlsr Persian V2
Apache-2.0
facebook/wav2vec2-large-xlsr-53をベースに、Common Voiceデータセットを使ってペルシア語(ペルシア語)で微調整された自動音声認識モデル
音声認識 その他
W
m3hrdadfi
47
6
Kabyle Xlsr
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mモデルをカバイル語データセットで微調整した自動音声認識(ASR)モデルです。
音声認識 Transformers その他
K
Akashpb13
39
2
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase