モデル選定

低リソース要件

# 低リソース要件

盆栽は5億パラメータの小型三値重み付け言語モデルで、LlamaアーキテクチャとMistralトークナイザーを使用し、トレーニングに使用されたトークン数は50億未満です。

大規模言語モデル

LingLongは軽量級の中国語事前学習言語モデルで、GPT-3アーキテクチャに基づいて構築されており、パラメータ規模は3.17億で、計算リソースが限られている研究者に適しています。

大規模言語モデル

Transformers 複数言語対応

Mythomax L2 13b Q4 K M GGUF

MythoMax L2 13bはQ4_K_M量子化バージョンに基づく大規模言語モデルで、テキスト生成タスクに適しています。

大規模言語モデル英語

Fietje 2はmicrosoft/phi-2を基にしたオランダ語最適化バージョンで、280億オランダ語トークンで訓練され、オランダ語テキスト生成能力を特別に向上させています

大規模言語モデル

Transformers その他

Uform Gen2 Qwen 500m

UForm-Genは小型の生成的視覚言語モデルで、主に画像キャプション生成と視覚的質問応答に使用されます。

画像生成テキスト

Transformers 英語

Tinymistral 248M GGUF

TinyMistral-248MはMistral 7Bモデルを基に事前学習された小型言語モデルで、パラメータ規模は約2.48億に縮小されており、主に下流タスクのファインチューニングに使用されます。

大規模言語モデル英語

Billsum Tiny Summarization

google/t5-efficient-tinyをファインチューニングしたテキスト要約モデルで、billsumデータセットでトレーニング済み

テキスト生成

Tinyllama 1.1B Step 50K 105b

TinyLlamaは1.1BパラメータのLlamaモデルで、3兆トークンの事前学習を計画しており、最適化により16台のA100-40G GPUで90日以内に学習を完了できます。

大規模言語モデル

Transformers 英語

Tinystories 1M ONNX

TinyStories-1M-ONNXはONNX形式の小型言語モデルで、テキスト生成タスクに適しています。

大規模言語モデル

Transformers 英語

Rubert Tiny Squad

cointegrated/rubert-tiny2をファインチューニングしたロシア語Q&Aモデル、SQuAD形式の質問応答タスクに適応

質問応答システム

このモデルは未知のデータセットでスクラッチから訓練されましたが、具体的な情報や用途はまだ不明です。

大規模言語モデル

Mahmoud1816Yasser

Distilroberta Base Model Transcript

distilroberta-baseモデルをファインチューニングしたテキスト処理モデルで、汎用NLPタスクに適しています

大規模言語モデル

Distilbert Base Uncased Finetuned Emotion Test 01

DistilBERTに基づく軽量級テキスト感情分類モデルで、emotionデータセットで微調整されました。

テキスト分類

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase