モデル選定

オープンソースLLM

# オープンソースLLM

Llama 3 6B V0.1

世界初の60億パラメータのLlama-3ベースモデル、Meta-Llama-3-8Bからダウングレード循環技術で作成され、10億の英語テキストトークンで継続事前学習を実施

大規模言語モデル

Transformers 英語

Meta-Llama-3-8Bからダウングレード循環技術で派生した、世界初の6BパラメータLlama-3ベースモデルの未訓練バージョン

大規模言語モデル

Transformers 英語

Openelm 3B Instruct

OpenELMは、階層的パラメータ割り当て戦略を用いてモデル精度を向上させるオープンソースの効率的な言語モデルのセットで、2.7億から30億パラメータのプリトレーニングおよび指示チューニングバージョンを含みます。

大規模言語モデル

LlammasはLlama-2-7Bモデルをエストニア語に適応させたオープンソース対話モデルで、2段階のトレーニングによりクロスランゲージ知識転移を実現

大規模言語モデル

Transformers 複数言語対応

AgentLM-70Bは、Llama-2-chatモデルをAgentInstructデータセットとShareGPTデータセットの混合トレーニングによって得られた大規模言語モデルで、エージェント能力と汎用言語能力の強化に焦点を当てています。

大規模言語モデル

Em German Leo Mistral

EM GermanはMistral/LeoLMを基にしたドイツ語大規模言語モデルファミリーで、ドイツ語命令データに対して微調整されており、ドイツ語テキストの理解と生成に優れています。

大規模言語モデル

Transformers ドイツ語

Mathcoder CL 7B

MathCoderシリーズのオープンソース大規模言語モデル。汎用数学問題解決のために設計され、Llama-2をファインチューニング

大規模言語モデル

Transformers 英語

KoLlama2はオープンソースプロジェクトで、英語ベースの大規模言語モデルLlama2の韓国語性能を向上させ、韓国語ユーザーにより質の高い言語対話体験をもたらすことを目的としています。

大規模言語モデル

Transformers 複数言語対応

OpenChatは一連のオープンソース言語モデルで、多様で高品質な多輪対話データセットで微調整され、限られたデータで高性能を実現することを目的としています。

大規模言語モデル

Transformers 英語

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase