Tiny-LLMオープンソースミニチュア大規模言語モデル - 少ないパラメータでも実用的な機能を備え、無料で利用可能

ホーム

Tiny LLM

arnir0によって開発

これはわずか1000万パラメータのマイクロ大規模言語モデルで、おそらく現在最小の機能的なLLMの1つです。

大規模言語モデル

Safetensors

オープンソースライセンス:MIT #超軽量LLM #低リソーステキスト生成 #教育デモツール

ダウンロード数 101.14k

リリース時間 : 11/3/2024

モデル概要

Tiny-LLMは軽量な大規模言語モデルで、主にテキスト生成タスクに使用されます。Finewebデータセットの320億トークンでトレーニングされ、1024トークンのコンテキスト長を持ちます。

モデル特徴

軽量

わずか1000万パラメータで、現在最小の機能的なLLMの1つ

効率的なトレーニング

Finewebデータセットの320億トークンでトレーニング

適度なコンテキスト長

1024トークンのコンテキスト長をサポート

モデル能力

テキスト生成

使用事例

テキスト生成

クリエイティブライティング

短編小説や創造的なテキストを生成

質問応答システム

簡単な質問に答えたり情報を提供

属性	详情
モデルタイプ	小型大規模言語モデル（LLM）
学習データ	HuggingFaceFW/fineweb
ライセンス	MIT

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Tiny LLM

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Tiny-LLM

🚀 クイックスタート

基本的な使用法

📚 ドキュメント

事前学習

データセットとライセンス