# 高精度音声テキスト変換

Parakeet Tdt 0.6b V2
NVIDIA Parakeet TDT 0.6B v2 を変換したMLXフォーマットの自動音声認識モデルで、効率的な音声テキスト変換タスクをサポートします。
音声認識
P
mlx-community
24.49k
13
Aidman Wav2vec2 Large Xls R 300m Irish Colab
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mを汎用音声データセットで微調整した音声認識モデルで、アイルランド語をサポートしています。
音声認識 Transformers
A
AIDman
110
0
Whisper Large V3 Turbo Cantonese Yue English
MIT
Whisperアーキテクチャを基に最適化された広東語と英語の混合音声認識モデルで、高精度な二言語転写をサポート
音声認識 Transformers
W
JackyHoCL
73
4
Whisper Large V2 Spanish
Apache-2.0
openai/whisper-large-v2を微調整したスペイン語音声認識モデル、Common Voice 11.0スペイン語テストセットでWER8.55%を達成
音声認識 Transformers
W
clu-ling
85
2
Exp W2v2t Sv Se Wavlm S42
Apache-2.0
microsoft/wavlm-largeをベースに微調整されたスウェーデン語自動音声認識モデルで、16kHzサンプリングレートの音声入力に適しています。
音声認識 Transformers
E
jonatasgrosman
20
0
Wav2vec2 Large Xls R 300m Slovenian
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceスロベニア語データセットでファインチューニングした音声認識モデルで、単語誤り率は0.3271です。
音声認識 Transformers
W
bekirbakar
278
0
Wav2vec2 Large Xls R 300m Kinyarwanda
Apache-2.0
facebook/wav2vec2-xls-r-300mをcommon_voiceデータセットで微調整したルワンダ語音声認識モデル
音声認識 Transformers
W
peter2000
13
0
Victor Hg Ptbr 2.0
Apache-2.0
common_voiceデータセットでfacebook/wav2vec2-xls-r-300mをファインチューニングしたポルトガル語音声認識モデル
音声認識 Transformers
V
Vkt
30
0
Wav2vec2 Large Xls R 300m Chinese Taiwan Colab
Apache-2.0
wav2vec2アーキテクチャに基づく大規模音声認識モデルで、中国語(台湾)音声に最適化されており、音声からテキストへの変換タスクに適しています。
音声認識 Transformers
W
RuiqianLi
17
1
Wav2vec2 Xlsr Nepali
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をネパール語データセットでファインチューニングした音声認識モデルです。
音声認識
W
shishirAI
22
2
Wav2vec2 2 Rnd
LibriSpeech ASR データセットでトレーニングされた自動音声認識モデルで、英語音声をテキストに変換します。
音声認識 Transformers
W
sanchit-gandhi
16
0
Wav2vec2 Base 10k Voxpopuli Ft Ro
FacebookのWav2Vec2アーキテクチャに基づく音声認識モデルで、ルーマニア語に対して微調整され、自動音声認識タスクに適しています。
音声認識 Transformers その他
W
facebook
36
0
Iloko Model
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53を未知のデータセットで微調整した自動音声認識(ASR)モデルで、イロカノ語(Iloko)の音声認識に対応しています。
音声認識 Transformers
I
denden
28
0
Wav2vec2 Large Xlsr Latvian Cv
Apache-2.0
facebook/wav2vec2-large-xlsr - 53モデルをベースに、ラトビア語のCommon Voiceデータセットで微調整された音声認識モデル
音声認識 その他
W
jimregan
5,323
1
Wav2vec2 Large Xlsr Or
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルをOdia言語でファインチューニングした自動音声認識(ASR)モデルで、Common Voiceデータセットを使用してトレーニングされています。
音声認識 その他
W
gchhablani
22
1
Wav2vec2 Base 10k Voxpopuli Ft Sl
Facebook Wav2Vec2基本モデルに基づき、VoxPopuliコーパスの10K未ラベルサブセットで事前学習され、スロベニア語転写データでファインチューニングされた自動音声認識モデルです。
音声認識 Transformers その他
W
facebook
26
0
Wav2vec2 Large Xlsr 53 Irish
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをベースに、Common Voiceデータセットでアイルランド語にファインチューニングした音声認識モデルです。
音声認識
W
cpierse
22
0
Wav2vec2 Large Xlsr Slovene
Apache-2.0
これはFacebookのwav2vec2-large-xlsr-53モデルを微調整したスロベニア語音声認識モデルで、Common Voiceデータセットを使用して訓練されています。
音声認識 その他
W
mrshu
23
2
Wav2vec2 Base 10k Voxpopuli Ft En
VoxPopuliコーパスの10Kラベルなしサブセットで事前学習され、英語書き起こしデータでファインチューニングされたWav2Vec2ベースモデルで、英語音声認識タスクに適しています。
音声認識 Transformers 英語
W
facebook
40
1
Wav2vec2 Common Voice Tr Demo
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルをCOMMON_VOICE - TRトルコ語データセットでファインチューニングした自動音声認識(ASR)モデルです。
音声認識 Transformers その他
W
shiyue
25
0
Wav2vec2 Large Xlsr 53 Latvian
Apache-2.0
これはFacebookのWav2Vec2-Large-XLSR-53モデルをラトビア語Common Voiceデータセットでファインチューニングした自動音声認識(ASR)モデルです。
音声認識 その他
W
anton-l
137
1
Wav2vec2 Base 10k Voxpopuli Ft Es
Facebook Wav2Vec2基本モデルを基に、VoxPopuliコーパスの10K未ラベルサブセットで事前学習し、スペイン語書き起こしデータでファインチューニングした音声認識モデルです。
音声認識 Transformers スペイン語
W
facebook
34
1
Wav2vec2 Base 10k Voxpopuli Ft De
Facebook Wav2Vec2ベースモデルを基に、VoxPopuliコーパスの10K無注釈サブセットで事前学習し、ドイツ語転写データでファインチューニングした音声認識モデル
音声認識 Transformers ドイツ語
W
facebook
46
1
Wav2vec2 Large Xlsr Hindi Commonvoice
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットでファインチューニングしたバージョンで、主にヒンディー語音声認識タスクに使用されます。
音声認識 Transformers
W
nikhil6041
17
0
W2v Timit Ft 4001
Wav2Vec 2.0アーキテクチャに基づく音声認識モデルで、TIMITデータセットで微調整されており、英語音声テキスト変換タスクに適しています
音声認識 Transformers
W
devin132
22
0
W2v Xlsr Dutch Lm
これはwav2vec2アーキテクチャに基づくオランダ語音声認識モデルで、Facebookによって開発され、オランダ語に特化して最適化されています。
音声認識 Transformers
W
Iskaj
23
0
Wav2vec2 Large Xls R 300m Hsb V3
Apache-2.0
facebook/wav2vec2-xls-r-300mをベースに、上ソルブ語(hsb)データセットで微調整した自動音声認識モデル
音声認識 Transformers その他
W
DrishtiSharma
18
0
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase