モデル選定

複数データセット融合

# 複数データセット融合

F5 TTS Vietnamese 100h

F5-TTSを微調整したコンパクト版で、150時間のベトナム語音声データでトレーニングされており、研究用途のみに限定されます。

音声合成その他

BERT-baseをファインチューニングした再現検出モデルで、重複コンテンツ検出、Q&Aシステム、意味的類似性分析などのシナリオに適しています。

テキスト分類

Transformers 英語

voc2vecは非言語人間データ専用に設計された基礎モデルで、wav2vec 2.0フレームワークを基に構築されており、事前学習データセットには約125時間の非言語音声が含まれています。

Transformers 英語

Rei-12BはClaude 3シリーズモデル(特にSonnetとOpus)の散文品質を再現することを目的とした大規模言語モデルで、Mistral-Nemo-Instructを微調整して作成されました

大規模言語モデル

Transformers 英語

Stt Uz Fastconformer Hybrid Large Pc

これはFastConformerアーキテクチャに基づく大型ウズベク語音声認識モデルで、TransducerとCTCの二重デコードをサポートし、複数のテストセットで優れた性能を発揮します。

音声認識その他

Llama3 Aloe 8B Alpha

Aloeは次世代の医療大規模言語モデルファミリーで、モデル融合と先進的なプロンプト戦略により、その規模範囲内で全ての先行オープンソースモデルと比較して高い競争力を持ち、最先端の成果を達成しています。

大規模言語モデル

Transformers 英語

orca_mini_3bはOpenLLaMa-3Bモデルをベースに訓練されたテキスト生成モデルで、WizardLM、Alpaca、Dolly-V2データセットからの命令と入力を用いて説明的チューニングが施され、Orca研究論文のデータセット構築方法が適用されています。

大規模言語モデル

Transformers 英語

Ultima Waifu Diffusion

安定拡散技術に基づくテキスト画像生成モデルで、高品質なアニメスタイル画像の生成に特化しています。

画像生成英語

Bp500 Base100k Voxpopuli

ブラジルポルトガル語に最適化された音声認識モデル、7つの公開データセット計453時間の音声でトレーニング

Transformers その他

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase