モデル選定

多分野インストラクションチューニング

# 多分野インストラクションチューニング

Llama 3.1 Nemotron 8B UltraLong 4M Instruct

Nemotron-UltraLong-8Bは超長文テキストシーケンス処理に特化した言語モデルで、最大400万トークンのコンテキストウィンドウをサポートし、標準ベンチマークテストでも卓越した性能を維持します。

大規模言語モデル

Transformers 英語

Llama 3.1 Nemotron 8B UltraLong 2M Instruct

Nemotron-UltraLong-8Bシリーズの超長文コンテキスト言語モデル、200万トークンのコンテキストウィンドウをサポート、Llama-3.1アーキテクチャに基づき最適化

大規模言語モデル

Transformers 英語

Llama 3.1 8B UltraLong 2M Instruct

Nemotron-UltraLong-8Bシリーズは、超長文シーケンスの処理に特化した言語モデルで、最大200万トークンのコンテキストウィンドウをサポートしながら優れた性能を維持します。

大規模言語モデル

Transformers 英語

Llama 3.1 Nemotron 8B UltraLong 1M Instruct

超長文シーケンス（最大100万、200万、400万トークン対応）処理専用に設計された大規模言語モデルで、標準ベンチマークテストでも優れた性能を維持

大規模言語モデル

Transformers 英語

Fugaku LLM 13B Instruct

Fugaku-LLMはスーパーコンピュータ'富岳'を完全利用してゼロから事前学習された国産モデルで、日本語を主な訓練データとしており、日本語処理において卓越した性能を発揮

大規模言語モデル

Transformers 複数言語対応

Fugaku-LLMはスーパーコンピュータ'富岳'を使用してゼロから事前学習された日本製の大規模言語モデルで、高い透明性と安全性を備え、特に日本語の表現に優れています

大規模言語モデル

Transformers 複数言語対応

Tinymistral 6x248M

TinyMistral-6x248MはLazyMergekitツールで6つのTinyMistralバリアントを融合した混合専門家システムで、nampdn-ai/mini-peS2oデータセットで事前学習済み

大規模言語モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase