モデル選定

複数データセットトレーニング

# 複数データセットトレーニング

Icedit Normal Lora

これはLoRA技術に基づく画像から画像への変換モデルで、主に非商用の画像編集タスクに使用されます。

画像生成英語

TIPOはテキスト事前サンプリングに基づくプロンプト最適化テキスト・トゥ・イメージシステムで、大規模言語モデルを使用してユーザー入力プロンプトを最適化し、生成モデルの品質と使いやすさを向上させます。

テキスト生成画像英語

F5アーキテクチャに基づいてゼロからトレーニングされたヒンディー語テキスト読み上げモデルで、インド工科大学マドラス校SPRING研究所によって開発されました。

音声合成その他

Noobai Xl Nai Xl Epsilonpred10version Sdxl

SDXLベースのアニメスタイルテキスト生成画像モデルで、初心者にも使いやすく、高品質なアニメキャラクターやスタイリッシュな画像を生成できます。

画像生成英語

TIPOはLLaMAアーキテクチャを採用した5億パラメータのモデルで、テキストから画像生成におけるプロンプト最適化のために設計されています。

テキスト生成画像英語

Whisper Tiny Vi

OpenAI Whisper-tinyアーキテクチャをベースにファインチューニングしたベトナム語自動音声認識(ASR)モデルで、複数のベトナム語データセットで優れた性能を発揮

Transformers その他

Deberta V3 Large Mnli Fever Anli Ling Wanli Binary

このモデルはDeBERTa-v3-largeアーキテクチャに基づくゼロショット分類モデルで、主に5つのNLIデータセットでトレーニングされており、元のNLIタスクに従うタスクに適しています。

テキスト分類

Transformers 英語

Ag Nli DeTS Sentence Similarity V1

このモデルはSentenceTransformersのCross-Encoderクラスを使用してトレーニングされ、2つの文の意味的類似度のスコアを予測するために使用されます。

テキスト埋め込み

Transformers 複数言語対応

Gpt2 Bangla Summurizer

これはGPT2アーキテクチャに基づくベンガル語テキスト要約生成モデルで、特にニュースコンテンツに最適化されています。

テキスト生成

Transformers その他

Vegam Whisper Medium Ml

これはthennal/whisper-medium-mlをCTranslate2モデル形式に変換したバージョンで、マラヤーラム語音声認識に使用されます

音声認識その他

Stt Es Conformer Transducer Large

これはスペイン語自動音声認識用の大型Conformer-トランスデューサーモデルで、約1.2億パラメータを持ち、1340時間のスペイン語音声データでトレーニングされています。

音声認識スペイン語

Stt Es Conformer Ctc Large

これはNVIDIAがトレーニングし公開した、スペイン語自動音声認識(ASR)用の大型Conformer-CTCモデルです。

音声認識スペイン語

Stt Fr Conformer Transducer Large

これはフランス語自動音声認識のための大規模なConformer-トランスデューサーモデルで、約1.2億のパラメータを持ち、1500時間以上のフランス語音声データでトレーニングされています。

音声認識フランス語

Wav2vec2 Base Vietnamese 160h

Wav2vec2ベースのベトナム語音声認識モデル、160時間のベトナム語音声データでファインチューニング

Transformers その他

Wav2vec2 Large Xlsr 53 Coraa Brazilian Portuguese Gain Normalization Sna

これはポルトガル語に特化してファインチューニングされたWav2vec 2.0モデルで、CORAA、CETUC、多言語LibriSpeechなど複数のポルトガル語音声データセットを使用してトレーニングされました。

Transformers その他

Wav2vec2 Xls R 1b Portuguese

これはXLS-R 1Bアーキテクチャに基づくポルトガル語自動音声認識モデルで、複数のポルトガル語音声データセットでファインチューニングされています。

Transformers その他

Wav2vec2 Xls R 1b Italian

これはXLS-R 1Bアーキテクチャに基づくイタリア語自動音声認識モデルで、複数のイタリア語データセットでファインチューニングされています

Transformers その他

Fine Tune XLSR Wav2Vec2 Speech2Text Vietnamese

これはMT5アーキテクチャに基づくベトナム語自動音声認識(ASR)修復モデルで、ベトナム語音声認識タスク向けにファインチューニングされています。

音声認識その他

Bp500 Base10k Voxpopuli

これはブラジルポルトガル語に最適化されたWav2vec 2.0音声認識モデルで、複数のブラジルポルトガル語データセットでファインチューニングされています

Transformers その他

Wav2vec2 Large Xlsr 53 Vietnamese

facebook/wav2vec2-large-xlsr-53モデルをベトナム語向けにファインチューニングした自動音声認識モデルで、16kHzサンプリングレートの音声入力をサポートします。

Transformers その他

Wav2vec2 Large Xlsr 53 Chinese Zh Cn

facebook/wav2vec2-large-xlsr-53モデルをファインチューニングした中国語音声認識モデルで、16kHzサンプリングレートの音声入力をサポートしています。

音声認識中国語

Wav2vec2 Large Xlsr Vietnamese

facebook/wav2vec2-large-xlsr-53モデルをベースにファインチューニングしたベトナム語自動音声認識モデル

音声認識その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase