Voc2vec Hubert Ls Pt
Apache-2.0
voc2vecは非言語人間データ専用に設計された基礎モデルで、HuBERTフレームワークを基盤として構築され、125時間の非言語音声データで事前学習されています。
音声分類
Transformers 英語

V
alkiskoudounas
114
1
Voc2vec
Apache-2.0
voc2vecは非言語人間データ専用に設計された基礎モデルで、wav2vec 2.0フレームワークを基に構築されており、事前学習データセットには約125時間の非言語音声が含まれています。
音声分類
Transformers 英語

V
alkiskoudounas
223
2
Distilhubert Finetuned Gtzan
Apache-2.0
DistilHuBERTアーキテクチャをGTZAN音楽分類データセットでファインチューニングした音響分類モデル、精度86%
音声分類
Transformers

D
f0ghedgeh0g
39
0
Distilhubert Finetuned Gtzan
Apache-2.0
このモデルはntu-spml/distilhubertをGTZAN音楽分類データセットでファインチューニングした音響分類モデルで、精度85%を達成しています。
音声分類
Transformers

D
Scher314
3
0
Wav2vec2 Base BirdSet XCL
wav2vec 2.0 は音声表現学習のための自己教師あり学習フレームワークで、ラベル付けされていない音声データから音声特徴を学習できます。
音声分類
Transformers

W
DBD-research-group
177
0
Hubert Large Gender Auto
Apache-2.0
HuBERT大規模モデルに基づく性別分類器で、精度は98.61%
音声分類
Transformers

H
ittailup
13
0
Wav2vec2 Base Gender Classification
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声性別分類モデルで、評価データセットでの精度は98.92%
音声分類
Transformers

W
7wolf
14
1
Wav2vec2 Audio Emotion Classification
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声感情分類モデルで、評価セットで73.98%の精度を達成
音声分類
Transformers

W
chin-may
77
5
Distilhubert Finetuned Gtzan
Apache-2.0
このモデルはNTU-SPMLのDistilHuBERTをGTZAN音楽分類データセットでファインチューニングしたバージョンで、主に音楽ジャンル分類タスクに使用されます。
音声分類
Transformers

D
Terps
15
0
Wav2vec2 Large Robust 24 Ft Age Gender
このモデルは生の音声信号を入力として、年齢予測値および性別確率(子供/女性/男性)を出力し、同時に最終層transformerのプール状態を出力します。
音声分類
Transformers

W
audeering
44.13k
33
Wav2vec2 Large Robust 6 Ft Age Gender
このモデルはWav2Vec2-Large-Robustを微調整することで、生の音声から話者の年齢と性別を予測できます。
音声分類
Transformers

W
audeering
19.29k
2
Distilhubert Finetuned Gtzan
Apache-2.0
このモデルはDistilHuBERTアーキテクチャに基づき、GTZAN音楽分類データセットでファインチューニングされた音声分類モデルで、主に音楽ジャンル分類タスクに使用されます。
音声分類
Transformers

D
calvpang
15
0
Distilhubert Finetuned Distilhubert
このモデルはDistilHuBERTをGTZAN音楽分類データセットでファインチューニングしたバージョンで、主に音楽ジャンル分類タスクに使用されます。
音声分類
Transformers

D
JanLilan
14
0
Distilhubert Finetuned Gtzan
Apache-2.0
DistilHuBERTをGTZAN音楽分類データセットでファインチューニングした軽量音響特徴抽出モデル
音声分類
Transformers

D
mory91
48
0
Distilhubert Finetuned Gtzan
Apache-2.0
このモデルはDistilHuBERTをGTZAN音楽分類データセットでファインチューニングしたバージョンで、主に音楽ジャンル分類タスクに使用されます。
音声分類
Transformers

D
Maldopast
14
0
My Awesome Model
Apache-2.0
DistilHuBERTアーキテクチャに基づく音声分類モデルで、GTZAN音楽ジャンル分類データセットで微調整され、精度は94.75%
音声分類
Transformers

M
AK-12
15
0
Distilhubert Finetuned Gtzan
Apache-2.0
GTZAN音楽ジャンル分類データセットでファインチューニングされたDistilHuBERTアーキテクチャに基づく音声分類モデル
音声分類
Transformers

D
technaxx
20
0
Distilhubert Finetuned Gtzan
Apache-2.0
このモデルはGTZAN音楽分類データセットで微調整されたDistilHuBERTベースの音響分類モデルで、76.25%の精度を達成
音声分類
Transformers

D
pratik33
14
0
Distilhubert Finetuned Gtzan
Apache-2.0
このモデルはGTZAN音楽分類データセットでファインチューニングされたDistilHuBERTベースのバージョンで、主に音楽ジャンル分類タスクに使用されます。
音声分類
Transformers

D
arham061
15
0
Distilhubert Finetuned Gtzan
Apache-2.0
GTZAN音楽分類データセットでファインチューニングされたDistilHuBERTベースの音声分類モデル、精度85%達成
音声分類
Transformers

D
kfahn
15
0
Distilhubert Finetuned Ravdess
Apache-2.0
DistilHuBERTアーキテクチャを基にRAVDESS音声感情データセットでファインチューニングされた音声感情認識モデル、精度92.36%
音声分類
Transformers

D
pollner
43
2
Audio Classification Model
Apache-2.0
facebook/wav2vec2-base-960hを微調整した音声分類モデルで、具体的な用途とトレーニングデータは明記されていません。
音声分類
Transformers

A
SinghManish
19
1
Distilhubert Finetuned Gtzan V2
Apache-2.0
このモデルはDistilHuBERTをGTZAN音楽分類データセットでファインチューニングしたバージョンで、主に音楽ジャンル分類タスクに使用されます。
音声分類
Transformers

D
MariaK
17
0
Ast Bird Model
Bsd-3-clause
オーディオデータセットに基づきMIT/ast-finetuned-audioset-10-10-0.4593をファインチューニングした音声分類モデル
音声分類
Transformers

A
saadashraf
22
0
Wav2vec2 Base Finetuned Coscan Age Group
Apache-2.0
wav2vec2-baseをcoscan-speechデータセットでファインチューニングした年齢グループ分類モデル、検証セットの精度は99.8%
音声分類
Transformers

W
versae
34
0
Ai Light Dance Singing2 Ft Wav2vec2 Large Xlsr 53
Apache-2.0
このモデルは、facebook/wav2vec2-large-xlsr-53をAI Light Danceデータセットでファインチューニングした自動音声認識モデルです。
音声認識
Transformers

A
gary109
26
1
Ai Light Dance Chord Ft Wav2vec2 Large Xlsr 53
Apache-2.0
このモデルはfacebook/wav2vec2-large-xlsr-53をベースに、GARY109/AI_Light_Dance - ONSET-CHORD2データセットでファインチューニングした自動音声認識モデルです。
音声認識
Transformers

A
gary109
46
0
Wav2vec2 Base Sound2
Apache-2.0
facebook/wav2vec2-baseをファインチューニングした音声処理モデルで、評価セットで53.57%の精度を達成
音声分類
Transformers

W
learningdude
17
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98