モデル選定

小規模事前学習

# 小規模事前学習

Llamaアーキテクチャに基づく5億パラメータのテキスト生成モデルで、ストーリー作成のために特別に設計されています。

テキスト生成

OPENCLIP SigLIP Tiny 14 Distill SigLIP 400m Cc9m

SigLIPアーキテクチャに基づく軽量な視覚言語モデルで、より大きなSigLIP-400mモデルから蒸留技術を用いて知識を抽出し、ゼロショット画像分類タスクに適しています。

Llama 3.2 400M Amharic

これはMeta社のLlama-3.2-1Bモデルをベースにした軽量版で、アムハラ語に特化して事前学習されており、4億のパラメータと1024トークンのコンテキスト長を持ちます。

大規模言語モデル

Transformers その他

Vit Betwixt Patch32 Clip 224.tinyclip Laion400m

ViTアーキテクチャに基づく小型CLIPモデルで、ゼロショット画像分類タスクに適しており、LAION-400Mデータセットでトレーニングされています。

GPT NeoX 1.3B Viet Final GGUF

31.3GBのベトナム語データで事前学習された1.3BパラメータのGPT-NeoXモデル

大規模言語モデル英語

TwiBERTはガーナおよび西アフリカ地域で広く使用されているトゥイ語専用に設計された事前学習言語モデルです

大規模言語モデル

Transformers その他

Roberta Base 100M 3

1Mから1Bトークン規模のデータセットで事前学習されたRoBERTaバリアントで、BASEとMED-SMALLの2つの仕様があり、リソースが限られた場面での自然言語処理タスクに適しています

大規模言語モデル

Roberta Med Small 1M 1

1Mトークンの小規模データで事前学習されたRoBERTaモデルで、MED-SMALLアーキテクチャを採用し、テキスト理解タスクに適しています。

大規模言語モデル

Roformer Chinese Char Small

RoFormerは回転位置エンコーディング(Rotary Position Embedding)を強化した中国語Transformerモデルで、テキスト補完タスクに適しています。

大規模言語モデル中国語

Kinyaroberta Small

これはキニャルワンダ語のデータセットに基づき、マスク言語モデリング（MLM）の目標で事前学習されたRoBERTaモデルで、大文字小文字の区別のないトークンを使用して事前学習されています。

大規模言語モデル

Gpt2 Small Indonesian 522M

これはインドネシア語ウィキペディアデータで事前学習されたGPT2-smallモデルで、インドネシア語テキスト生成タスクに特化しています。

大規模言語モデルその他

Roberta Base 10M 1

異なる規模のデータセット(1M-1Bトークン)で事前学習されたRoBERTaシリーズモデルで、BASEとMED-SMALLの2種類の仕様を含む

大規模言語モデル

IT5は、イタリア語に対して大規模なシーケンス-to-シーケンスTransformerモデルの事前学習を行った最初のモデルファミリーで、元のT5モデルの方法に従っています。

大規模言語モデルその他

Roberta Base 100M 1

10億トークンスケールで事前学習されたRoBERTaベースモデル、検証パープレキシティは3.93、英語テキスト処理タスクに適しています。

大規模言語モデル

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

大規模言語モデル

Transformers 複数言語対応

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

対話システム

Transformers 英語

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase