Wav2vec2 Base Librispeech Demo Colab
Apache-2.0
このモデルはfacebook/wav2vec2-baseをLibriSpeechデータセットでファインチューニングした音声認識モデルで、評価セットで0.3174の単語誤り率を達成しました。
音声認識
Transformers

W
vishwasgautam
14
0
Hubert Base Librispeech Demo Colab
Apache-2.0
facebook/hubert-large-ls960-ftをファインチューニングした音声認識モデルで、LibriSpeechデータセットでトレーニング済み
音声認識
Transformers

H
vishwasgautam
101
0
F5 Ita Test
これはF5-TTSモデルのイタリア語ファインチューニング版で、facebook/multilingual_librispeechデータセットでトレーニングされ、イタリア語のテキスト読み上げタスクに特化しています。
音声合成 その他
F
alien79
98
2
Speecht5 Finetuned Multilingual Librispeech De
MIT
Microsoft SpeechT5モデルをドイツ語LibriSpeechデータセットでファインチューニングしたテキストから音声へのモデル
音声合成
Transformers ドイツ語

S
semaj83
14
0
Librispeech 100h Supervised Meta
Apache-2.0
Kuray107/librispeech-5h-supervisedをファインチューニングした音声認識モデルで、100時間のLibriSpeechデータセットでトレーニング
音声認識
Transformers

L
Kuray107
25
0
Data2vec Audio Large 960h
Apache-2.0
Data2Vecは音声、視覚、言語タスクに適用可能な汎用自己教師あり学習フレームワークです。この音声大規模モデルはLibriSpeechの960時間音声データで事前学習とファインチューニングされ、自動音声認識タスク向けに最適化されています。
音声認識
Transformers 英語

D
facebook
2,531
7
Unispeech Sat Base 100h Libri Ft
Apache-2.0
UniSpeech-SAT基本モデルを基に、LibriSpeech音声データで100時間のファインチューニングを行った自動音声認識モデル
音声認識
Transformers 英語

U
microsoft
643
4
Wavlm Base Libri Clean 100
WavLMアーキテクチャに基づく自動音声認識モデルで、LibriSpeech CLEANデータセット(100時間)でファインチューニング済み
音声認識
Transformers

W
anjulRajendraSharma
73
0
Wav2vec2 100m Mls German Ft
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-100mを多言語LibriSpeechドイツ語データセットでファインチューニングした自動音声認識モデルです
音声認識
Transformers

W
patrickvonplaten
27
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98