Stt Ru Fastconformer Hybrid Large Pc Onnx
NVIDIA FastConformer-Hybrid Large は、FastConformer アーキテクチャに基づくロシア語自動音声認識モデルで、CTC と RNN-T デコーダーをサポートしています。
音声認識
S
istupakov
163
1
Gigaam V2 Onnx
MIT
GigaAM v2は自動音声認識(ASR)モデルで、ロシア語音声からテキストへの変換タスクをサポートし、CTCとRNN-Tの2つのアーキテクチャを提供します。
音声認識 その他
G
istupakov
170
2
Gigaam Rnnt
MIT
GigaAM-v2-RNNT はロシア語自動音声認識(ASR)モデルで、RNNTアーキテクチャに基づいており、音声からテキストへの変換タスクに適しています。
音声認識
Transformers その他

G
waveletdeboshir
70
1
Gigaam Ctc
MIT
GigaAM-v2-CTCはCTC損失関数でトレーニングされたロシア語自動音声認識(ASR)モデルで、Hugging Face transformersライブラリを通じて利用可能です。
音声認識
Transformers その他

G
waveletdeboshir
255
1
Whisper Large V3 Russian Ties Podlodka V1.0
TIES融合手法を用いて統合されたロシア語音声認識モデル、電話音声認識効果を最適化
音声認識
Transformers その他

W
Apel-sin
96
1
Wav2vec2 Large Xls R 300m Ru
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voice_17_0データセットでファインチューニングしたロシア語自動音声認識(ASR)モデルで、単語誤り率(WER)は0.195です。
音声認識
Transformers

W
NLPVladimir
56
1
Whisper Large V3 Turbo Russian
MIT
OpenAI Whisper Large V3 Turboを基に最適化したロシア語自動音声認識(ASR)モデル、Mozilla Common Voice 17ロシア語データセットでファインチューニング
音声認識
Transformers その他

W
dvislobokov
1,022
12
Faster Whisper Large V3 Ru Podlodka Int8
Apache-2.0
これはOpenAI Whisperアーキテクチャに基づくロシア語音声認識モデルで、ロシア語音声からテキストへの変換タスクに最適化され、ctranslate2形式に変換されて推論効率が向上しています。
音声認識 その他
F
bzikst
29
3
Faster Whisper Large V3 Russian
Apache-2.0
これはantony66/whisper-large-v3-russianモデルのctranslate2変換バージョンで、ロシア語音声認識タスク向けに最適化されています。
音声認識
Transformers その他

F
bzikst
155
3
Faster Whisper Large V3 Ru Podlodka
Apache-2.0
これは bond005/whisper-large-v3-ru-podlodka の ctranslate2 変換バージョンで、ロシア語音声認識タスク向けに最適化されています。
音声認識
Transformers その他

F
bzikst
23
1
Whisper Large V3 Russian
OpenAI Whisper-large-v3をファインチューニングしたロシア語音声認識モデルで、ロシア語認識性能を最適化
音声認識
Transformers その他

W
antony66
6,665
60
Whisper Large V3 Ru Podlodka
Apache-2.0
これはWhisper Large V3をベースにしたロシア語音声認識モデルで、ロシア語音声に特化して最適化されています。
音声認識
Transformers その他

W
bond005
570
8
Whisper Tiny Ru
Apache-2.0
このモデルはopenai/whisper-tinyをベースに、Common Voice 14.0データセットで微調整したロシア語自動音声認識モデルです。
音声認識
Transformers

W
whitemouse84
333
1
Ru Whisper Small
Apache-2.0
openai/whisper-smallをベースにファインチューニングしたロシア語音声認識モデル、Sberdevices_golos_10h_crowdデータセットでトレーニング
音声認識
Transformers その他

R
Val123val
43
1
Training V2
Apache-2.0
OpenAI Whisper-baseモデルをCommon Voice 11.0ロシア語データセットでファインチューニングした音声認識モデル
音声認識
Transformers その他

T
SofiaK
15
1
Stt Ru Fastconformer Hybrid Large Pc
これはロシア語自動音声認識のためのFastConformerハイブリッドモデルで、TransducerとCTCデコーダーを組み合わせ、パラメータ規模は約1.15億です。
音声認識 その他
S
nvidia
6,513
10
Stt Ru Conformer Ctc Large
これはロシア語の自動音声認識用の大規模なConformer-CTCモデルで、約1636時間のロシア語音声データでトレーニングされ、約1.2億のパラメータを持っています。
音声認識 その他
S
nvidia
452
5
Wav2vec2 Large Ru Golos With Lm
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53をベースに微調整されたロシア語音声認識モデルで、Sberdevices Golosデータセットを使用して訓練され、識別精度を向上させるために2-gram言語モデルが統合されています。
音声認識
Transformers その他

W
bond005
434
15
Wav2vec2 Large Ru Golos
Apache-2.0
facebook/wav2vec2-large-xlsr-53をファインチューニングしたロシア語音声認識モデル。Sberdevices Golosデータセットでトレーニングされ、16kHz音声入力をサポート
音声認識
Transformers その他

W
bond005
1,182
12
Wav2vec2 Large Multilang Cv Ru
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をcommon_voiceデータセットでファインチューニングしたバージョンで、主にロシア語音声認識タスクに使用されます。
音声認識
Transformers

W
cutten
16
0
Wav2vec2 Large Xls R 300m Russian Colab Beam Search Test
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングしたロシア語音声認識モデルで、評価セットで0.468の単語誤り率を達成しました。
音声認識
Transformers

W
jfealko
18
0
Wav2vec2 Russian
wav2vec2アーキテクチャに基づくロシア語音声認識モデル。認識結果は対応するテキスト誤り訂正ネットワークで後処理可能
音声認識
Transformers

W
UrukHan
100
8
Wav2vec2 Base Russian Big Kaggle
Apache-2.0
このモデルはfacebook/wav2vec2-baseをロシア語データセットでファインチューニングした音声認識モデルです
音声認識
Transformers

W
Eyvaz
17
1
Wav2vec2 Xls R 1b Russian
Apache-2.0
XLS-R 1Bアーキテクチャを基に微調整されたロシア語音声認識モデル、Common Voice 8.0などのデータセットでトレーニング
音声認識
Transformers その他

W
jonatasgrosman
765
14
Wav2vec2 Large Xlsr 53 Russian
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたロシア語音声認識モデル、16kHzサンプリングレートの音声入力をサポート
音声認識 その他
W
jonatasgrosman
3.9M
54
Wav2vec2 Large Xls R 300m Ru
これはWav2Vec2 XLS-Rアーキテクチャに基づくロシア語自動音声認識モデルで、パラメータ規模は300m、公共音声およびロバスト音声イベントデータセットで評価されています。
音声認識
Transformers その他

W
mobedkova
37
1
Wav2vec2 Large Xlsr 53 Russian
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたロシア語自動音声認識(ASR)モデルで、Common Voiceロシア語データセットで17.39%の単語誤り率(WER)を達成。
音声認識 その他
W
anton-l
735
4
Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Russian
Apache-2.0
これはFacebookのwav2vec2-large-100k-voxpopuliモデルをベースに、Common Voice 7.0とM-AILABSのロシア語データを用いて微調整された音声認識モデルです。
音声認識
Transformers その他

W
Edresson
25
6
Wav2vec2 Base Russian Modified Kaggle
Apache-2.0
このモデルは、facebook/wav2vec2-baseを未知のデータセットで微調整したバージョンで、ロシア語音声処理タスクに適しています。
音声認識
Transformers

W
Eyvaz
16
1
Wav2vec2 Large 100k Voxpopuli Ft Common Voice Plus TTS Dataset Plus Data Augmentation Russian
Apache-2.0
FacebookのWav2vec2 Large 100k Voxpopuliモデルをベースに、Common Voice 7.0、M-AILABSデータセットおよびデータ拡張技術を使用してロシア語で微調整された音声認識モデルです。
音声認識
Transformers その他

W
Edresson
23
2
Wav2vec2 Xlsr 1b Ru
facebook/wav2vec2-xls-r-1bをCommon Voiceデータセットでファインチューニングしたロシア語自動音声認識モデル
音声認識
Transformers その他

W
RASMUS
41
2
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98