Whisper Large V3 Broad Accent
Bsd-3-clause
Whisper-Large-v3ベースの英語広範アクセント分類モデルで、ブリテン諸島、北米地域およびその他3種類の英語アクセントを識別可能
音声分類
Safetensors 英語
W
tiantiaf
156
1
Whisper Large V3 Voice Quality
Whisper Large v3を基にした音質分類モデルで、音声のピッチ、音質、音量、明瞭度、リズムなどの特徴を分析します。
音声分類
Safetensors 英語
W
tiantiaf
162
1
Gemma 3 4b It Speech
Gemma-3-MMはGemma-3-4b-itを拡張したマルチモーダル指示モデルで、音声処理能力を追加し、テキスト、画像、音声入力を処理してテキスト出力を生成できます。
音声生成テキスト
Transformers

G
junnei
383
12
Teochew Whisper Medium
MIT
Whisper中型モデルを微調整した潮州語(潮州方言)音声認識モデルで、中国南方の閩南語系の潮州方言を認識するために特別に設計されています。
音声認識
Transformers

T
efficient-nlp
194
31
DENTAL CLICK Classifier
Wav2vec2アーキテクチャに基づく音声認識モデルで、音声中の歯茎吸着音を識別するために特別に設計されています。
音声認識
Transformers 英語

D
JBJoyce
24
0
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98