Whisper Large V3 French Distil Dec16 Ct2
MIT
これはWhisper Large V3のフランス語蒸留バージョンで、フランス語自動音声認識に最適化されており、ctranslate2による効率的な推論を実現しています。
音声認識 フランス語
W
Kelno
35
1
Faster Whisper Large V3 French Distil Dec16
MIT
Whisper-Large-V3のフランス語蒸留バージョン、デコーダ層数を減らすことで推論効率を最適化しつつ良好な性能を維持
音声認識
Transformers フランス語

F
brandenkmurray
25
3
Whisper Large V3 French Distil Dec8
MIT
これはWhisper-Large-V3フランス語モデルの蒸留バージョンで、デコーダー層数を減らすことで推論速度とメモリ使用量を最適化し、良好な性能を維持しています。
音声認識
Transformers フランス語

W
bofenghuang
32
4
Whisper Large V3 French Distil Dec16
MIT
Whisper-Large-V3-フランス語蒸留版は、デコーダ層数を32層から16層に削減し、大規模データセットで蒸留訓練を行ったフランス語音声認識モデルです。このモデルは性能を維持しながら、メモリ消費量と推論時間を大幅に削減しました。
音声認識
Transformers フランス語

W
bofenghuang
2,461
10
Whisper Large V3 French
MIT
OpenAI Whisper-large-v3をファインチューニングしたフランス語自動音声認識モデルで、大文字小文字、句読点、数字の予測をサポート
音声認識
Transformers フランス語

W
bofenghuang
771
28
Stt Fr Fastconformer Hybrid Large Pc
これはフランス語自動音声認識モデルで、FastConformerアーキテクチャに基づき、TransducerとCTCデコーダを組み合わせており、高い精度とマルチドメイン適応性を備えています。
音声認識 フランス語
S
nvidia
1,331
5
Whisper Large V2 French
Apache-2.0
openai/whisper-large-v2を基にファインチューニングしたフランス語音声認識モデルで、2200時間以上のフランス語音声データでトレーニングされています
音声認識
Transformers フランス語

W
bofenghuang
103
14
Whisper Small Cv11 French
Apache-2.0
openai/whisper-smallを基にファインチューニングしたフランス語自動音声認識モデルで、Common Voice 11.0のフランス語データセットで訓練され、大文字小文字と句読点の予測をサポートしています。
音声認識
Transformers フランス語

W
bofenghuang
266
4
Whisper Medium French
Apache-2.0
openai/whisper-mediumをcommon_voice_11_0データセットでファインチューニングしたフランス語音声認識モデルで、標準化WERは11.1406を達成し、オリジナルモデルを上回ります。
音声認識
Transformers フランス語

W
pierreguillou
260
9
Asr Wav2vec2 Ctc French
Apache-2.0
これはwav2vec2-FR-7K-largeモデルを基にファインチューニングされたフランス語自動音声認識(ASR)モデルで、2200時間以上のフランス語音声データでトレーニングされています。
音声認識
Transformers フランス語

A
bofenghuang
520
12
Exp W2v2t Fr Xls R S250
Apache-2.0
facebook/wav2vec2-xls-r-300mモデルをベースに、Common Voice 7.0フランス語データセットでファインチューニングした自動音声認識モデル
音声認識
Transformers フランス語

E
jonatasgrosman
20
0
Exp W2v2t Fr Vp Fr S438
Apache-2.0
facebook/wav2vec2-large-fr-voxpopuliモデルを基にファインチューニングしたフランス語自動音声認識モデルで、Common Voice 7.0フランス語データセットでトレーニングされています。
音声認識
Transformers フランス語

E
jonatasgrosman
20
0
Exp W2v2t Fr Unispeech S42
Apache-2.0
microsoft/unispeech-large-1500h-cvモデルをベースに、Common Voice 7.0(フランス語)データセットでファインチューニングした音声認識モデル
音声認識
Transformers フランス語

E
jonatasgrosman
20
0
Stt Fr Conformer Transducer Large
これはフランス語自動音声認識のための大規模なConformer-トランスデューサーモデルで、約1.2億のパラメータを持ち、1500時間以上のフランス語音声データでトレーニングされています。
音声認識 フランス語
S
nvidia
31
10
Stt Fr Conformer Ctc Large
これはConformerアーキテクチャに基づくフランス語自動音声認識(ASR)の大規模モデルで、CTC損失関数を使用し、1500時間以上のフランス語音声データでトレーニングされています。
音声認識 フランス語
S
nvidia
361
6
Trained French
Apache-2.0
これはfacebook/wav2vec2-base-960hをファインチューニングしたフランス語音声認識モデルで、評価セットで1.0の単語誤り率を達成しました。
音声認識
Transformers

T
eugenetanjc
151
0
Xtreme S Xlsr Minds14 Fr
Apache-2.0
facebook/wav2vec2-xls-r-300mをベースにGOOGLE/XTREME_S - MINDS14.FR-FRデータセットでファインチューニングした自動音声認識モデル
音声認識
Transformers

X
anton-l
41
1
Wav2vec2 Base 10k Voxpopuli Ft Fr
Facebook Wav2Vec2アーキテクチャに基づく音声認識モデルで、VoxPopuliコーパスの10Kのラベルなしフランス語データで事前学習され、フランス語転写データでファインチューニングされています。
音声認識
Transformers フランス語

W
facebook
75
0
Wav2vec2 Large Xlsr 53 French
Apache-2.0
これはXLSR - 53大規模モデルを微調整したフランス語音声認識モデルで、Common Voiceデータセットで訓練され、高い精度でフランス語の音声をテキストに変換できます。
音声認識 フランス語
W
jonatasgrosman
47.83k
11
Unispeech 1350 En 353 Fr Ft 1h
UniSpeechはラベル付きデータとラベルなしデータを組み合わせた統一音声表現学習モデルで、特にフランス語向けにファインチューニングされています。
音声認識
Transformers フランス語

U
microsoft
20
0
Asr Wav2vec2 Commonvoice Fr
Apache-2.0
CommonVoiceフランス語データセットを基に訓練されたwav2vec 2.0音声認識モデルで、CTC/Attentionアーキテクチャを使用し、言語モデルは不要です。
音声認識 フランス語
A
speechbrain
250
10
Wav2vec2 Xls R 1b French
Apache-2.0
これはXLS-R 1Bアーキテクチャに基づくフランス語自動音声認識モデルで、複数のフランス語音声データセットで微調整されています。
音声認識
Transformers フランス語

W
jonatasgrosman
379
8
Wav2vec2 Large Fr Voxpopuli French
Apache-2.0
facebook/wav2vec2-large-fr-voxpopuliをファインチューニングしたフランス語音声認識モデル、Common Voice 6.1フランス語データセットでトレーニング、16kHz音声入力に対応
音声認識 フランス語
W
jonatasgrosman
51
3
Wav2vec2 Large Xlsr 53 French
Apache-2.0
Facebookが開発したWav2Vec 2.0アーキテクチャに基づく大規模フランス語音声認識モデルで、自動音声テキスト変換タスクをサポート
音声認識 フランス語
W
facebook
2,264
13
Wav2vec2 Base Fr Voxpopuli
VoxPopuliフランス語の未ラベルデータで事前学習されたWav2Vec2ベースモデル、フランス語音声認識タスクに適しています
音声認識
Transformers フランス語

W
facebook
30
0
Asr Crdnn Commonvoice Fr
Apache-2.0
これはCommonVoiceフランス語データセットでトレーニングされたエンドツーエンド自動音声認識システムで、CRDNNアーキテクチャとCTCおよびアテンションメカニズムを組み合わせています。
音声認識 フランス語
A
speechbrain
167
7
Wav2vec2 Base Fr Voxpopuli V2
FacebookのWav2Vec2ベースモデルで、フランス語のみで事前学習され、VoxPopuliコーパスの22.8kの無ラベルデータを使用しています。
音声認識
Transformers フランス語

W
facebook
103
1
Wav2vec2 Large Fr Voxpopuli
VoxPopuliフランス語コーパスで事前学習された大規模音声認識モデル、フランス語音声からテキストへの変換タスクをサポート
音声認識 フランス語
W
facebook
31
0
Xls R 300m Fr 0
Apache-2.0
これはfacebook/wav2vec2-xls-r-300mをCommon Voice 8.0フランス語データセットで微調整した自動音声認識(ASR)モデルで、フランス語音声からテキストへの変換タスクをサポートします。
音声認識
Transformers フランス語

X
AlexN
24
0
Wav2vec2 Large Xlsr 53 French
Apache-2.0
これはwav2vec2アーキテクチャに基づく自動音声認識(ASR)モデルで、フランス語に特化して微調整され、Common Voiceフランス語テストセットで12.82%の単語誤り率(WER)を達成しました。
音声認識
Transformers フランス語

W
Ilyes
31
4
Wav2vec2 FR 7K Large
Apache-2.0
7.6K時間のフランス語音声で訓練されたLarge wav2vec2モデルで、自発的な音声、朗読音声、放送音声のデータが含まれています。
音声認識
Transformers フランス語

W
LeBenchmark
1,091
12
Wav2vec2 FR 1K Base
Apache-2.0
1千時間のフランス語音声で訓練されたwav2vec2の基礎モデルで、音声認識などのタスクをサポートします。
音声認識
Transformers フランス語

W
LeBenchmark
85
1
Wav2vec2 Large Xlsr 53 French
Apache-2.0
facebook/wav2vec2-large-xlsr-53をCommon Voiceフランス語データセットで微調整した自動音声認識モデルで、テストのWERは34.86%です。
音声認識 フランス語
W
MehdiHosseiniMoghadam
21
0
Xls R 300m Fr
これはfacebook/wav2vec2-xls-r-300mをCommon Voice 8.0フランス語データセットでファインチューニングした自動音声認識(ASR)モデルです
音声認識
Transformers フランス語

X
AlexN
21
1
Wav2vec2 Large Xlsr 53 French Punctuation
Apache-2.0
wav2vec2-large-xlsr-53アーキテクチャに基づくフランス語自動音声認識モデルで、句読点予測をサポート
音声認識 フランス語
W
Ilyes
23
0
Wav2vec2 FR 2.6K Base
Apache-2.0
2.6千時間のフランス語音声でトレーニングされた基本wav2vec2モデル、自発音声データを含まない
音声認識
Transformers フランス語

W
LeBenchmark
41
0
Wav2vec2 FR 7K Base
Apache-2.0
7.6千時間のフランス語音声で訓練されたLarge wav2vec2モデルで、自発的、朗読式、放送式の音声を含む
音声認識
Transformers フランス語

W
LeBenchmark
26
1
Xls R 1b Cv 8 Fr
Apache-2.0
これは、facebook/wav2vec2-xls-r-1bをベースに、MOZILLA-FOUNDATION/COMMON_VOICE_8_0 - FRデータセットで微調整されたフランス語自動音声認識モデルです。
音声認識
Transformers フランス語

X
Plim
26
0
Wav2vec2 FR 3K Base
Apache-2.0
2.9K時間のフランス語音声で学習したwav2vec2の基礎モデルで、自発的、朗読、放送音声に対応
音声認識
Transformers フランス語

W
LeBenchmark
31
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98