Parakeet Tdt 0.6b V2 Onnx
NVIDIA Parakeet TDT 0.6B V2 は自動音声認識(ASR)タスクに基づくモデルで、英語音声からテキストへの変換タスクに適しています。
音声認識 英語
P
istupakov
129
3
Nue Asr
Apache-2.0
Nue ASRはエンドツーエンドの日本語音声認識モデルで、事前学習された音声と言語モデルを統合し、認識精度が高く高速です。
音声認識
Transformers 複数言語対応

N
rinna
722
24
Asr Wav2vec2 Commonvoice 14 Es
Apache-2.0
これはCommonVoiceスペイン語データセットでトレーニングされたエンドツーエンド自動音声認識システムで、wav2vec 2.0事前トレーニングモデルとCTCデコーダーを組み合わせています。
音声認識 スペイン語
A
speechbrain
22
3
Asr Whisper Medium Commonvoice Ar
Apache-2.0
CommonVoiceアラビア語データセットでファインチューニングされたWhisper medium音声認識モデル、SpeechBrainチームによって開発
音声認識 アラビア語
A
speechbrain
17
2
Asr Whisper Medium Commonvoice Fa
Apache-2.0
CommonVoice-14.0ペルシャ語データセットでファインチューニングされたwhisper mediumモデルで、ペルシャ語自動音声認識タスク用です。
音声認識 その他
A
speechbrain
21
3
Faster Whisper Large V2 Japanese 5k Steps
MIT
Whisper Large V2モデルに基づく日本語自動音声認識(ASR)モデルで、CTranslate2で最適化変換され、効率的な推論をサポートします。
音声認識
Transformers 日本語

F
zh-plus
280
18
Asr Conformer Transformerlm Librispeech
Apache-2.0
SpeechBrainフレームワークに基づく自動音声認識モデルで、ConformerエンコーダーとTransformerデコーダーを使用し、LibriSpeechデータセットでトレーニングされ、英語音声認識をサポートします。
音声認識 英語
A
speechbrain
984
7
Asr Whisper Large V2 Commonvoice Fa
Apache-2.0
これはwhisper-large-v2アーキテクチャに基づく自動音声認識モデルで、CommonVoiceデータセット上のペルシア語に特化して微調整されています。
音声認識 その他
A
speechbrain
103
15
Wav2vec2 Large Xlsr 53 Spanish Ep5 944h
スペイン語自動音声認識用の音響モデルで、facebook/wav2vec2-large-xlsr-53を5エポックにわたってファインチューニングし、約944時間のスペイン語データを使用しています。
音声認識
Transformers スペイン語

W
carlosdanielhernandezmena
111
3
Whisper Tiny.en
Apache-2.0
Whisperは、68万時間のアノテーション付きデータで学習された事前学習済みの自動音声認識(ASR)モデルで、強力な汎化能力を持っています。
音声認識 英語
W
openai
145.30k
103
Whisper Small
Apache-2.0
Whisperは、事前学習された自動音声認識(ASR)および音声翻訳モデルで、68万時間のラベル付きデータで学習され、強力な汎化能力を持っています。
音声認識 複数言語対応
W
openai
2.0M
381
Icefall Asr Gigaspeech Conformer Ctc
Icefallはk2フレームワークに基づく自動音声認識(ASR)ツールキットで、効率的で柔軟な音声認識モデルのトレーニングと推論に焦点を当てています。
音声認識 英語
I
speechcolab
0
0
Asr Wav2vec2 Dvoice Wolof
Apache-2.0
これはウォロフ語に特化した自動音声認識モデルで、wav2vec 2.0アーキテクチャに基づき、DVoiceデータセットで訓練され、ウォロフ語の音声を文字起こしすることができます。
音声認識 その他
A
speechbrain
44
4
Asr Wav2vec2 Dvoice Amharic
Apache-2.0
これはアムハラ語向けの自動音声認識モデルで、wav2vec 2.0アーキテクチャとCTC/Attentionメカニズムを使用してトレーニングされています
音声認識 その他
A
speechbrain
96
9
Wav2vec2 Large Xlsr Turkish Demo Colab
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルをcommon_voiceトルコ語データセットでファインチューニングした音声認識モデル
音声認識
Transformers

W
masoumehb
21
0
Wav2vec2 Large Xls R 300m Turkish Colab
Apache-2.0
facebook/wav2vec2-xls-r-300mをcommon_voiceトルコ語データセットでファインチューニングした音声認識モデル
音声認識
Transformers

W
abhiGOAT
19
0
Ascend With English
timit_asrデータセットを使用してascendモデルをファインチューニングした英語音声認識モデル
音声認識
Transformers

A
GleamEyeBeast
23
0
Wav2vec2 Base Timit Demo Colab
Apache-2.0
facebook/wav2vec2-baseをTIMITデータセットでファインチューニングした音声認識モデルで、単語誤り率(WER)は0.3382
音声認識
Transformers

W
wasilkas
24
0
Asr Wav2vec2 Commonvoice En
Apache-2.0
これはCommonVoice英語データセットを使って訓練されたエンドツーエンドの自動音声認識システムで、wav2vec 2.0の事前学習モデルとCTCデコーダを組み合わせています。
音声認識 英語
A
speechbrain
681
12
Wav2vec2 Large Xlsr Kyrgyz
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルを基に、キルギス語のユニバーサル音声データセットでファインチューニングされた自動音声認識モデルです。
音声認識 その他
W
iarfmoose
22
2
Wav2vec2 2 Bert Large No Adapter
LibriSpeechデータセットで訓練された自動音声認識(ASR)モデルで、英語音声をテキストに変換します
音声認識
Transformers

W
speech-seq2seq
15
1
Wav2vec2 Xls R 300m Bas CV8 V2
Apache-2.0
facebook/wav2vec2-xls-r-300mをベースにCommon Voice 8データセットでファインチューニングされた自動音声認識モデルで、バスク語(bas)をサポートします。
音声認識
Transformers その他

W
emre
18
0
Wav2vec2 Base Vietnamese 250h
wav2vec 2.0アーキテクチャに基づくベトナム語自動音声認識モデルで、13,000時間の未ラベル付きオーディオと250時間のラベル付きデータで訓練されています。
音声認識
Transformers その他

W
nguyenvulebinh
6,868
39
Asr Wav2vec2 Commonvoice Fr
Apache-2.0
CommonVoiceフランス語データセットを基に訓練されたwav2vec 2.0音声認識モデルで、CTC/Attentionアーキテクチャを使用し、言語モデルは不要です。
音声認識 フランス語
A
speechbrain
250
10
Wav2vec2 Base 100h
Apache-2.0
LibriSpeechの100時間データでトレーニングされたWav2Vec2基本版音声認識モデル
音声認識
Transformers 英語

W
vuiseng9
26
0
Wav2vec2 Base Turkish Cv7
Apache-2.0
wav2vec2アーキテクチャに基づくトルコ語自動音声認識モデル、Common Voice 7.0トルコ語データセットでファインチューニング済み
音声認識
Transformers その他

W
cahya
21
0
Wav2vec2 Large Xlsr Thai Demo
Apache-2.0
facebook/wav2vec2-large-xlsr-53をタイ語汎用音声データセットでファインチューニングした音声認識モデル
音声認識
Transformers その他

W
sakares
609
5
Wav2vec2 Large Xlsr 53 Lithuanian
Apache-2.0
facebook/wav2vec2-large-xlsr-53モデルを基に、Common Voiceデータセットを使用してリトアニア語にファインチューニングした自動音声認識モデルです。
音声認識 その他
W
anton-l
29
0
Wav2vec2 Random
TIMIT_ASRデータセットを使用してwav2vec2-base-randomモデルをファインチューニングした自動音声認識モデル
音声認識
Transformers

W
patrickvonplaten
16
0
Wav2vec2 Large Xlsr Mongolian
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53を基に、モンゴル語ユニバーサル音声データセットでファインチューニングされた自動音声認識モデルです
音声認識 その他
W
bayartsogt
16
1
Asr Crdnn Commonvoice Fr
Apache-2.0
これはCommonVoiceフランス語データセットでトレーニングされたエンドツーエンド自動音声認識システムで、CRDNNアーキテクチャとCTCおよびアテンションメカニズムを組み合わせています。
音声認識 フランス語
A
speechbrain
167
7
XLS R Marathi
Apache-2.0
facebook/wav2vec2-xls-r-300mをマラーティー語データセットでファインチューニングした自動音声認識モデル
音声認識
Transformers その他

X
StephennFernandes
34
0
Wav2vec2 Large Xls R 300m Hindi Colab
Apache-2.0
facebook/wav2vec2-xls-r-300mを汎用音声データセットでファインチューニングしたヒンディー語音声認識モデル
音声認識
Transformers

W
nimrah
16
0
Asr Transformer Aishell
Apache-2.0
SpeechBrainフレームワークに基づいて事前学習されたAISHELL(中国語(普通話))エンドツーエンド自動音声認識システムで、Transformerエンコーダ+結合デコーダ構造を採用しています。
音声認識 英語
A
speechbrain
76
11
Wav2vec2 Large Xlsr Estonian
Apache-2.0
これはfacebook/wav2vec2-large-xlsr-53モデルをファインチューニングしたエストニア語自動音声認識(ASR)モデルで、Common Voiceデータセットを使用してトレーニングされました。
音声認識 その他
W
m3hrdadfi
26
0
Wav2vec2 Large Xlsr 53 Turkish
Apache-2.0
これは、Facebookのwav2vec2-large-xlsr-53モデルをトルコ語のCommon Voiceデータセットで微調整した自動音声認識(ASR)モデルです。
音声認識 その他
W
ceyda
54
1
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98