# 多方言サポート

Roest Wav2vec2 1B V2
Openrail
これはデンマークで最先端の音声認識モデルで、AlvenirがCoRalプロジェクトの一環として訓練したもので、CoRal-v2データセットで訓練され、さまざまなデンマーク方言をカバーしています。
音声認識 その他
R
CoRal-project
91
1
Roest Wav2vec2 315m V2
Openrail
Alvenirによって訓練されたデンマーク最先端の音声認識モデル、CoRal-v2データセットに基づき、複数のデンマーク方言をサポート
音声認識 Safetensors その他
R
CoRal-project
238
2
Nllb1.3 Smugri4 V0.01
これはNLLB-1.3bモデルを29のフィン・ウゴル語族言語の並列データで微調整したバージョンで、複数の方言/バリエーション生成をサポートします。
機械翻訳 Transformers 複数言語対応
N
tartuNLP
39
2
Mms 300m Arabic Dialect Identifier
このモデルはMMS-300mをファインチューニングしたアラビア語方言音声認識モデルで、現代標準アラビア語および4つの主要なアラビア語方言を識別できます。
音声分類 Transformers アラビア語
M
badrex
73
2
Wav2vec LnNor IPA Ft
wav2vec2-baseをファインチューニングした音素認識モデルで、英語音声を国際音声記号(IPA)に変換可能
音声認識 英語
W
MultiBridge
16
1
Whisper Small Tel
Apache-2.0
OpenAI Whisper-large-v2をテルグ語音声データセットでファインチューニングした音声認識モデル
音声認識 Transformers その他
W
sagarchapara
17
1
Whisper Uz
Apache-2.0
OpenAI Whisper Mediumモデルをファインチューニングしたウズベク語自動音声認識モデル
音声認識 Transformers その他
W
mustafoyev202
110
1
F5 TTS Arabic
F5-TTSを微調整した高品質なアラビア語音声合成モデルで、地域ごとの発音やアクセントの多様性をサポート
音声合成 複数言語対応
F
IbrahimSalah
104
11
Audiox South V1
Apache-2.0
AudioXはJivi AIが開発した多言語自動音声認識モデルで、特にインド南部の言語に最適化されており、タミル語、テルグ語、カンナダ語、マラヤーラム語をサポートしています。
音声認識 その他
A
jiviai
148
1
Arabic Retrieval V1.0
Apache-2.0
高性能なアラビア語情報検索モデルで、sentence-transformersフレームワークを基に構築され、アラビア語の豊かさと複雑さに最適化されています。
テキスト埋め込み アラビア語
A
omarelshehy
366
3
Nb Whisper Large Distil Turbo Beta
Apache-2.0
ノルウェー国立図書館が開発したノルウェー語自動音声認識モデルの軽量化高速バージョン。蒸留プロセスによりパラメータ数を削減しながら、文字起こし品質を維持。
音声認識 Transformers 複数言語対応
N
NbAiLab
478
1
Whisper Large V3 Turbo Cantonese Yue English
MIT
Whisperアーキテクチャを基に最適化された広東語と英語の混合音声認識モデルで、高精度な二言語転写をサポート
音声認識 Transformers
W
JackyHoCL
73
4
Whisper Tiny Myanmar
Apache-2.0
このモデルはopenai/whisper-tinyをビルマ語音声データセットでファインチューニングした自動音声認識(ASR)モデルで、ビルマ語音声からテキストへの変換タスクをサポートします。
音声認識 Transformers その他
W
chuuhtetnaing
84
1
Speech Accent Pt Br Classifier
音声ベースのアクセント分類器で、ポルトガル語(ブラジル)とその他のアクセントを区別します。
音声分類 Transformers 複数言語対応
S
rmayormartins
24
2
Mms Tts Nova Train
CC
これはシャン語(Shan)のテキストを音声に変換する(TTS)モデルで、シャン語のテキストを自然な音声に変換します。
音声合成 Transformers その他
M
NorHsangPha
28
0
Chat2db SQL 7B
Apache-2.0
CodeLlamaをファインチューニングした70億パラメータモデルで、自然言語からSQLへの変換タスク専用に設計されており、複数のSQL方言と16kのコンテキスト長処理をサポート
大規模言語モデル Transformers 複数言語対応
C
Chat2DB
382
51
Adabtranslate Darija
Apache-2.0
ダリジャ語(モロッコアラビア語)から現代標準アラビア語(MSA)への翻訳モデル、26,000組の人手注釈とGPT-4拡張のテキストペアでトレーニング
機械翻訳 Transformers
A
itsmeussa
35
8
Indic Whisper Nodcil
MIT
IndicWhisperはインド言語に最適化された最先端の音声認識モデルで、インド言語の各種ベンチマークテストで優れた性能を発揮します。
音声認識 その他
I
parthiv11
253
3
Indic Whisper Hi Multi Gpu
MIT
IndicWhisperはインド言語向けに最適化された最先端の音声認識モデルで、インド言語の各種ベンチマークテストで優れた性能を発揮します。
音声認識 その他
I
parthiv11
72
4
Whisper Base Arabic
Apache-2.0
Whisper-baseをベースにしたアラビア語音声認識モデルで、複数のアラビア語データセットで微調整され、アラビア語音声テキスト変換タスクに特化
音声認識 Transformers 複数言語対応
W
YazanSalameh
46
3
Arabic Morocco Speech To Text
Apache-2.0
Whisper-large-v3ベースのアラビア語音声認識モデル、モロッコ訛りに最適化
音声認識 Transformers アラビア語
A
smerchi
194
10
Nb Whisper Large Verbatim
Apache-2.0
OpenAI Whisperを基に開発されたノルウェー語自動音声認識モデルで、追加トレーニングによりすべて小文字で句読点のない逐語転写を実現
音声認識 複数言語対応
N
NbAiLabBeta
765
2
Nb Whisper Medium Verbatim
Apache-2.0
Whisper技術に基づくノルウェー語自動音声認識モデル、25万ステップの訓練を経て、正確な逐語転写をサポート
音声認識 複数言語対応
N
NbAiLabBeta
73
1
Malaysian Whisper Base
マレーシアデータセットでファインチューンされたWhisperベースモデル、マレー語と英語の音声認識をサポート
音声認識 Transformers 複数言語対応
M
mesolitica
143
2
Arat5 Arabic Dialects Translation
Apache-2.0
このモデルはアラビア方言データセットで訓練され、アラビア方言を標準アラビア語(MSA)に翻訳するために使用されます。
機械翻訳 Transformers アラビア語
A
PRAli22
136
4
Speecht5 Finetuned Fleurs Zh
MIT
microsoft/speecht5_ttsをベースにfleursデータセットでファインチューニングした中国語テキスト読み上げモデル
音声合成 Transformers
S
GCYY
117
1
Indicwav2vec Odia
Apache-2.0
Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識(ASR)モデル、AI4Bharatによって開発
音声認識 Transformers その他
I
ai4bharat
401
2
Norbert3 Xs
Apache-2.0
NorBERT 3 xsはノルウェー語に最適化されたBERTモデルで、次世代NorBERT言語モデルシリーズの最小バージョンであり、パラメータ数は15Mです。
大規模言語モデル Transformers その他
N
ltg
228
4
Whisper Small Cv11 French
Apache-2.0
openai/whisper-smallを基にファインチューニングしたフランス語自動音声認識モデルで、Common Voice 11.0のフランス語データセットで訓練され、大文字小文字と句読点の予測をサポートしています。
音声認識 Transformers フランス語
W
bofenghuang
266
4
Whisper Telugu Base
Apache-2.0
OpenAI Whisper-baseモデルをファインチューニングしたテルグ語自動音声認識(ASR)モデルで、複数の公開テルグ語データセットで訓練
音声認識 その他
W
vasista22
279
10
Whisper Small Kab
Apache-2.0
OpenAI Whisper-smallモデルをファインチューニングしたジョージア語自動音声認識モデル
音声認識 Transformers その他
W
BlueRaccoon
37
2
Whisper Large V2 Malayalam
Apache-2.0
これはOpenAI Whisper Large V2モデルをマラヤーラム語音声認識タスク用にファインチューニングしたバージョンで、Common Voice 11.0データセットでトレーニングされています
音声認識 Transformers その他
W
DrishtiSharma
23
4
Whisper Large Sme
Apache-2.0
Whisper-large-v2をファインチューニングした北サーミ語音声認識モデルで、テストセットでの単語誤り率は24.91%
音声認識 Transformers その他
W
NbAiLab
40
5
Wav2vec2 Large Xlsr 53 Spanish Ep5 944h
スペイン語自動音声認識用の音響モデルで、facebook/wav2vec2-large-xlsr-53を5エポックにわたってファインチューニングし、約944時間のスペイン語データを使用しています。
音声認識 Transformers スペイン語
W
carlosdanielhernandezmena
111
3
Wav2vec2 1b Npsc Nst Bokmaal
Apache-2.0
このモデルは、ノルウェー語Bokmål方言の音声データセットでfacebook/wav2vec2-xls-r-1bを微調整した自動音声認識(ASR)モデルです
音声認識 Transformers
W
NbAiLab
30
0
Opus Mt Tc Big Ar En
これはアラビア語から英語への翻訳用ニューラル機械翻訳モデルで、OPUS-MTプロジェクトの一部です。
機械翻訳 Transformers 複数言語対応
O
Helsinki-NLP
18.14k
18
Wav2vec2hindiasr
Apache-2.0
Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識(ASR)モデル、公開音声データセットでファインチューニング済み
音声認識 Transformers
W
SAGAR4REAL
31
1
Wav2vec2 Large Hindicone
Apache-2.0
このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングした音声認識モデルで、ヒンディー語をサポートしています。
音声認識 Transformers
W
SAGAR4REAL
16
0
Aradia Ctc V1
アラビア語大規模音声データセットでトレーニングされた自動音声認識モデル
音声認識 Transformers
A
abdusah
16
0
Wav2vec2 Large Xls R 300m Assamese
Apache-2.0
このモデルは、facebook/wav2vec2-xls-r-300mをcommon_voice_7_0データセットでファインチューニングしたバージョンで、アッサム語の自動音声認識タスクに使用されます。
音声認識 Transformers その他
W
infinitejoy
13
1
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase