Kinyawhisper
MIT
KinyaWhisperはOpenAI Whisperモデルをファインチューニングしたルワンダ語自動音声認識(ASR)システムで、低リソースの先住民言語向けに設計されています。
音声認識
Transformers その他

K
benax-rw
149
3
Whisper Small Ta
Apache-2.0
このモデルは、OpenAIのWhisper Smallをタミル語のCommon Voice 17.0データセットでファインチューニングした音声認識モデルで、単語誤り率(WER)は43.23%です。
音声認識
Transformers その他

W
navin-kumar-j
38
1
Indian Accent English Whisper Finetuned Epoch 15
MIT
OpenAI Whisper-large-v3-turboをファインチューニングしたインド英語アクセント音声認識モデルで、インド英語アクセントデータセットで7.99%の単語誤り率を達成
音声認識
Transformers 英語

I
Tejveer12
21
2
Quran Whisper Base Fine Tune
Apache-2.0
このモデルは、openai/whisper-baseをquran-ayat-speech-to-textデータセットでファインチューニングしたアラビア語音声認識モデルで、コーラン経文の音声から文字への変換タスクに特化しています。
音声認識
Transformers アラビア語

Q
Baselhany
35
1
Whisper Base Pl
Apache-2.0
OpenAI Whisper-baseモデルをポーランド語Common Voice 17.0データセットでファインチューニングした音声認識モデル
音声認識
Transformers その他

W
marcsixtysix
27
1
Vlzcrz Whisper Small Japanese 2
Apache-2.0
openai/whisper-smallをCommon Voice 17.0データセットでファインチューニングした日本語音声認識モデル
音声認識
Transformers 日本語

V
vlzcrz
28
1
Viwhisper Medium
MIT
ベトナム語音声認識タスク向けに最適化されたWhisper-mediumモデル、1308時間のベトナム語データでファインチューニング済み
音声認識
Transformers その他

V
NhutP
139
4
Akan Whisper Model
OpenAI Whisperモデルをファインチューニングしたバージョンで、ガーナの低リソース言語であるアカン語の自動音声認識タスク向けに設計されています
音声認識
Transformers その他

A
GiftMark
354
3
Whisper Small Khmer
MIT
openai/whisper-smallをファインチューニングした音声認識モデルで、クメール語の文字起こし精度を特別に最適化
音声認識
Transformers その他

W
Vira21
15
1
Whisper Tiny Myanmar
Apache-2.0
このモデルはopenai/whisper-tinyをビルマ語音声データセットでファインチューニングした自動音声認識(ASR)モデルで、ビルマ語音声からテキストへの変換タスクをサポートします。
音声認識
Transformers その他

W
chuuhtetnaing
84
1
Akylai STT Small
Apache-2.0
キルギス語Whisper ASRは、キルギス語に特化した自動音声認識ソリューションで、事前学習済みWhisperモデルをファインチューニングしたものです。
音声認識
Transformers その他

A
the-cramer-project
73
1
Detect Language
Apache-2.0
Whisper Mediumモデルをファインチューニングした言語識別モデルで、FLEURSデータセット上の言語分類タスク専用
音声分類
Transformers

D
apparaomulpuriril
15
0
Whisper Sinhala Audio To Text
Apache-2.0
openai/whisper-smallをファインチューニングしたシンハラ語音声認識モデルで、シンハラ語音声をテキストに変換できます。
音声認識
Transformers

W
AqeelShafy7
229
2
Whisper Small Kyrgyz
Whisperアーキテクチャに基づくキルギス語自動音声認識(ASR)モデルで、キルギス共和国大統領府国家言語・言語政策全国委員会の支援により開発
音声認識
Transformers その他

W
UlutSoftLLC
841
4
Whisper Tiny Vi
Apache-2.0
OpenAI Whisper-tinyアーキテクチャをベースにファインチューニングしたベトナム語自動音声認識(ASR)モデルで、複数のベトナム語データセットで優れた性能を発揮
音声認識
Transformers その他

W
doof-ferb
44
2
Phowhisper Small
Bsd-3-clause
PhoWhisperはベトナム語自動音声認識のために特別に設計されたシステムで、Whisperモデルをファインチューニングしており、さまざまなベトナム語のアクセントをサポートしています。
音声認識
Transformers その他

P
vinai
2,725
8
Whisper Large V3 Japanese 4k Steps
Apache-2.0
openai/whisper-large-v3をベースにCommon Voice 16.1日本語データセットでファインチューニングした音声認識モデル、4000ステップ訓練
音声認識
Transformers 日本語

W
drewschaub
94
4
Haitian Speech To Text
Apache-2.0
ハイチクレオール語に最適化されたWhisper音声認識モデルで、高精度な音声テキスト変換能力を備えています
音声認識
Transformers その他

H
ZeeshanGeoPk
156
1
Audiosangraha Audio To Text
Apache-2.0
openai/whisper-smallをファインチューニングした音声からテキストへの変換モデルで、音声翻訳とテキスト生成タスクをサポートします。
音声認識
Transformers

A
AqeelShafy7
224
4
Whisper Large V3 Atco2 Asr
Apache-2.0
OpenAI Whisper-large-v3をファインチューニングした音声認識モデルで、航空交通管制(ATCO)シナリオに特化しており、単語誤り率17.04%
音声認識
Transformers

W
jlvdoorn
1,792
5
Whisper Large V2 Spanish
Apache-2.0
OpenAI Whisper-large-v2モデルをCommon Voice 13.0スペイン語データセットでファインチューニングした音声認識モデル
音声認識
Transformers

W
Sandiago21
38
3
Asr Whisper Medium Commonvoice Fa
Apache-2.0
CommonVoice-14.0ペルシャ語データセットでファインチューニングされたwhisper mediumモデルで、ペルシャ語自動音声認識タスク用です。
音声認識 その他
A
speechbrain
21
3
Whisper Base Japanese
Apache-2.0
このモデルは、Common Voice、JVS、JSUTデータセットを使用してopenai/whisper-baseを日本語向けにファインチューニングしたもので、日本語音声認識タスクに適しています。
音声認識
Transformers 日本語

W
Ivydata
137
3
Afrispeech Large A100
Whisper-large-v2をファインチューニングしたアフリカ言語音声認識モデル。afrispeech-200データセットで訓練され、単語誤り率(WER)は14.81
音声認識
Transformers

A
Seyfelislem
20
1
Whisper Small Ft Common Language Id
Apache-2.0
openai/whisper-smallをファインチューニングした汎用言語識別モデルで、評価データセットでの精度は88.6%
音声分類
Transformers

W
sanchit-gandhi
256.20k
2
Whisper Medium Fleurs Lang Id
Apache-2.0
OpenAI Whisper-mediumをファインチューニングした音声言語識別モデルで、FLEURSデータセットで88.05%の精度を達成
音声分類
Transformers

W
sanchit-gandhi
590.30k
14
Whisper Large V2 Kazakh
Apache-2.0
このモデルはOpenAIのWhisper Large V2をカザフ語Common Voice 11.0データセットでファインチューニングした音声認識モデルです
音声認識
Transformers その他

W
DrishtiSharma
40
3
Whisper Large V2 Cv11 German
Apache-2.0
openai/whisper-large-v2をCommon Voice 11.0ドイツ語データセットでファインチューニングした自動音声認識モデルで、ドイツ語音声をテキストに変換可能、単語誤り率5.76
音声認識
Transformers ドイツ語

W
bofenghuang
179
16
Whisper Medium Ar
Apache-2.0
openai/whisper-mediumをアラビア語データセットでファインチューニングした音声認識モデル
音声認識
Transformers

W
arbml
49
3
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98