モデル選定

マルチタスク最適化

# マルチタスク最適化

Instella 3B Long Instruct

Instella-LongはAMDによって開発された、128Kの文脈長をサポートする3Bパラメータのオープンソース言語モデルで、長文脈ベンチマークテストで優れた性能を発揮します。

大規模言語モデル

霊曦はInclusionAIがオープンソース化した大規模混合エキスパート言語モデルで、簡易版は総パラメータ168億、活性化パラメータ27.5億を有し、卓越した性能を発揮します。

大規模言語モデル

Xgen Small 9B Instruct R

xGen-smallはエンタープライズ向けのコンパクトな言語モデルで、ドメイン特化型データキュレーション、スケーラブルな事前学習、長文脈拡張、強化学習による微調整を通じて、予測可能な低コストで長文脈性能を実現します。

大規模言語モデル

Transformers 英語

Olmo 2 0425 1B Instruct GGUF

OLMo 2 1B命令版はOLMo-2-0425-1B-RLVR1モデルのポストトレーニングバリアントで、教師ありファインチューニング、DPOトレーニング、RLVRトレーニングを経ており、様々なタスクで最先端の性能を実現することを目的としています。

大規模言語モデル英語

Olmo 2 0425 1B Instruct

OLMo 2 1Bはallenai/OLMo-2-0425-1B-RLVR1モデルの後訓練バリアントで、教師あり微調整、DPOトレーニング、RLVRトレーニングを経ており、様々なタスクで最先端の性能を実現することを目的としています。

大規模言語モデル

Transformers 英語

Mmrexcev GRPO V0.420

これはSLERP法によって融合された事前学習済み言語モデルで、Captain-Eris_Violet-GRPO-v0.420とMMR-E1の2つのモデルの特徴を組み合わせています。

大規模言語モデル

Reasoning SCE Coder V1.0

SCE融合手法に基づいて構築された32Bパラメータ規模の大規模言語モデルで、複数の高性能事前学習モデルを融合

大規模言語モデル

BenevolenceMessiah

DeepSeek-R1は深度求索が開発した第一世代推論モデルで、大規模な強化学習トレーニングにより、数学、コード、推論タスクで優れた性能を発揮します。

大規模言語モデル

Gte Modernbert Base

ModernBERT事前学習エンコーダーに基づくテキスト埋め込みモデルで、8192トークンの長文処理をサポートし、MTEB、LoCO、COIRなどの評価タスクで優れた性能を発揮します。

テキスト埋め込み

Transformers 英語

瑠璃は日本語汎用テキスト埋め込みモデルで、文類似度計算と特徴抽出に特化しており、cl-nagoya/ruri-pt-small-v2ベースモデルでトレーニングされています。

テキスト埋め込み日本語

Ruriは日本語テキスト埋め込みに特化したモデルで、文の類似度計算やテキスト特徴抽出を効率的に行えます。

テキスト埋め込み日本語

Ruriは日本語に特化した汎用テキスト埋め込みモデルで、文の類似度計算と特徴抽出タスクに焦点を当てています。

テキスト埋め込み

Safetensors 日本語

SILMA 9B Instruct V1.0

SILMA-9B-Instruct-v1.0は90億パラメータのオープンソースアラビア語大規模言語モデルで、アラビア語タスクで優れた性能を発揮し、GoogleのGemmaアーキテクチャに基づいて構築されています。

大規模言語モデル

Transformers 複数言語対応

高品質なロシア語文章埋め込み計算用BERTモデル、cointegrated/LaBSE-en-ruを基に最適化、意味的テキスト類似度タスクに適応

テキスト埋め込み

Transformers その他

Beyonder 4x7B V2

Beyonder-4x7B-v2は、混合エキスパートモデル（MoE）アーキテクチャに基づく大規模言語モデルで、4つのエキスパートモジュールで構成され、会話、プログラミング、クリエイティブライティング、数学的推論などのさまざまな分野のタスクに特化しています。

大規模言語モデル

Chinese Lert Large

LERTは言語学理論に基づく事前学習言語モデルで、言語学知識を活用してモデル性能を向上させることを目的としています。

大規模言語モデル

Transformers 中国語

Hindi Tpu Electra

ELECTRAの基礎アーキテクチャに基づいて訓練されたヒンディー語の事前学習言語モデルで、複数のヒンディー語NLPタスクで多言語BERTよりも優れた性能を発揮します。

大規模言語モデル

Transformers その他

Gottbert Base Last

GottBERTはドイツ語専用に設計された初のRoBERTaモデルで、OSCARデータセットのドイツ語部分に基づいて事前学習され、基本版と大規模版の2つのバージョンを提供します。

大規模言語モデルドイツ語

Mengzi Bert Base

300Gの中国語コーパスに基づいて事前学習されたBERTモデルで、MLM、POS、SOPタスクを用いて学習

大規模言語モデル

Transformers 中国語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase