モデル選定

多方言サポート

# 多方言サポート

Roest Wav2vec2 1B V2

これはデンマークで最先端の音声認識モデルで、AlvenirがCoRalプロジェクトの一環として訓練したもので、CoRal-v2データセットで訓練され、さまざまなデンマーク方言をカバーしています。

音声認識その他

Roest Wav2vec2 315m V2

Alvenirによって訓練されたデンマーク最先端の音声認識モデル、CoRal-v2データセットに基づき、複数のデンマーク方言をサポート

Safetensors その他

Nllb1.3 Smugri4 V0.01

これはNLLB-1.3bモデルを29のフィン・ウゴル語族言語の並列データで微調整したバージョンで、複数の方言/バリエーション生成をサポートします。

Transformers 複数言語対応

Mms 300m Arabic Dialect Identifier

このモデルはMMS-300mをファインチューニングしたアラビア語方言音声認識モデルで、現代標準アラビア語および4つの主要なアラビア語方言を識別できます。

Transformers アラビア語

Wav2vec LnNor IPA Ft

wav2vec2-baseをファインチューニングした音素認識モデルで、英語音声を国際音声記号(IPA)に変換可能

音声認識英語

Whisper Small Tel

OpenAI Whisper-large-v2をテルグ語音声データセットでファインチューニングした音声認識モデル

Transformers その他

OpenAI Whisper Mediumモデルをファインチューニングしたウズベク語自動音声認識モデル

Transformers その他

F5-TTSを微調整した高品質なアラビア語音声合成モデルで、地域ごとの発音やアクセントの多様性をサポート

音声合成複数言語対応

Audiox South V1

AudioXはJivi AIが開発した多言語自動音声認識モデルで、特にインド南部の言語に最適化されており、タミル語、テルグ語、カンナダ語、マラヤーラム語をサポートしています。

音声認識その他

Arabic Retrieval V1.0

高性能なアラビア語情報検索モデルで、sentence-transformersフレームワークを基に構築され、アラビア語の豊かさと複雑さに最適化されています。

テキスト埋め込みアラビア語

Nb Whisper Large Distil Turbo Beta

ノルウェー国立図書館が開発したノルウェー語自動音声認識モデルの軽量化高速バージョン。蒸留プロセスによりパラメータ数を削減しながら、文字起こし品質を維持。

Transformers 複数言語対応

Whisper Large V3 Turbo Cantonese Yue English

Whisperアーキテクチャを基に最適化された広東語と英語の混合音声認識モデルで、高精度な二言語転写をサポート

Whisper Tiny Myanmar

このモデルはopenai/whisper-tinyをビルマ語音声データセットでファインチューニングした自動音声認識(ASR)モデルで、ビルマ語音声からテキストへの変換タスクをサポートします。

Transformers その他

Speech Accent Pt Br Classifier

音声ベースのアクセント分類器で、ポルトガル語（ブラジル）とその他のアクセントを区別します。

Transformers 複数言語対応

Mms Tts Nova Train

これはシャン語（Shan）のテキストを音声に変換する（TTS）モデルで、シャン語のテキストを自然な音声に変換します。

Transformers その他

CodeLlamaをファインチューニングした70億パラメータモデルで、自然言語からSQLへの変換タスク専用に設計されており、複数のSQL方言と16kのコンテキスト長処理をサポート

大規模言語モデル

Transformers 複数言語対応

Adabtranslate Darija

ダリジャ語（モロッコアラビア語）から現代標準アラビア語（MSA）への翻訳モデル、26,000組の人手注釈とGPT-4拡張のテキストペアでトレーニング

Indic Whisper Nodcil

IndicWhisperはインド言語に最適化された最先端の音声認識モデルで、インド言語の各種ベンチマークテストで優れた性能を発揮します。

音声認識その他

Indic Whisper Hi Multi Gpu

IndicWhisperはインド言語向けに最適化された最先端の音声認識モデルで、インド言語の各種ベンチマークテストで優れた性能を発揮します。

音声認識その他

Whisper Base Arabic

Whisper-baseをベースにしたアラビア語音声認識モデルで、複数のアラビア語データセットで微調整され、アラビア語音声テキスト変換タスクに特化

Transformers 複数言語対応

Arabic Morocco Speech To Text

Whisper-large-v3ベースのアラビア語音声認識モデル、モロッコ訛りに最適化

Transformers アラビア語

Nb Whisper Large Verbatim

OpenAI Whisperを基に開発されたノルウェー語自動音声認識モデルで、追加トレーニングによりすべて小文字で句読点のない逐語転写を実現

音声認識複数言語対応

Nb Whisper Medium Verbatim

Whisper技術に基づくノルウェー語自動音声認識モデル、25万ステップの訓練を経て、正確な逐語転写をサポート

音声認識複数言語対応

Malaysian Whisper Base

マレーシアデータセットでファインチューンされたWhisperベースモデル、マレー語と英語の音声認識をサポート

Transformers 複数言語対応

Arat5 Arabic Dialects Translation

このモデルはアラビア方言データセットで訓練され、アラビア方言を標準アラビア語(MSA)に翻訳するために使用されます。

Transformers アラビア語

Speecht5 Finetuned Fleurs Zh

microsoft/speecht5_ttsをベースにfleursデータセットでファインチューニングした中国語テキスト読み上げモデル

Indicwav2vec Odia

Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識(ASR)モデル、AI4Bharatによって開発

Transformers その他

NorBERT 3 xsはノルウェー語に最適化されたBERTモデルで、次世代NorBERT言語モデルシリーズの最小バージョンであり、パラメータ数は15Mです。

大規模言語モデル

Transformers その他

Whisper Small Cv11 French

openai/whisper-smallを基にファインチューニングしたフランス語自動音声認識モデルで、Common Voice 11.0のフランス語データセットで訓練され、大文字小文字と句読点の予測をサポートしています。

Transformers フランス語

Whisper Telugu Base

OpenAI Whisper-baseモデルをファインチューニングしたテルグ語自動音声認識(ASR)モデルで、複数の公開テルグ語データセットで訓練

音声認識その他

Whisper Small Kab

OpenAI Whisper-smallモデルをファインチューニングしたジョージア語自動音声認識モデル

Transformers その他

Whisper Large V2 Malayalam

これはOpenAI Whisper Large V2モデルをマラヤーラム語音声認識タスク用にファインチューニングしたバージョンで、Common Voice 11.0データセットでトレーニングされています

Transformers その他

Whisper Large Sme

Whisper-large-v2をファインチューニングした北サーミ語音声認識モデルで、テストセットでの単語誤り率は24.91%

Transformers その他

Wav2vec2 Large Xlsr 53 Spanish Ep5 944h

スペイン語自動音声認識用の音響モデルで、facebook/wav2vec2-large-xlsr-53を5エポックにわたってファインチューニングし、約944時間のスペイン語データを使用しています。

Transformers スペイン語

carlosdanielhernandezmena

Wav2vec2 1b Npsc Nst Bokmaal

このモデルは、ノルウェー語Bokmål方言の音声データセットでfacebook/wav2vec2-xls-r-1bを微調整した自動音声認識(ASR)モデルです

Opus Mt Tc Big Ar En

これはアラビア語から英語への翻訳用ニューラル機械翻訳モデルで、OPUS-MTプロジェクトの一部です。

Transformers 複数言語対応

Wav2vec2hindiasr

Wav2Vec2アーキテクチャに基づくヒンディー語自動音声認識(ASR)モデル、公開音声データセットでファインチューニング済み

Wav2vec2 Large Hindicone

このモデルはfacebook/wav2vec2-xls-r-300mをcommon_voiceデータセットでファインチューニングした音声認識モデルで、ヒンディー語をサポートしています。

アラビア語大規模音声データセットでトレーニングされた自動音声認識モデル

Wav2vec2 Large Xls R 300m Assamese

このモデルは、facebook/wav2vec2-xls-r-300mをcommon_voice_7_0データセットでファインチューニングしたバージョンで、アッサム語の自動音声認識タスクに使用されます。

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase