Tinyllama V0
T
Tinyllama V0
Maykeyeによって開発
Llamaアーキテクチャで再構築された最初のTinyStories-1Mバージョンで、子供向けストーリー生成を目的としたコンセプト検証モデル
ダウンロード数 565.95k
リリース時間 : 7/8/2023
モデル概要
このモデルはLlamaアーキテクチャで再構築されたTinyStoriesバージョンで、主に子供向けの短編ストーリー生成に使用されます。コンセプト検証プロジェクトとして、小規模データセットでの言語モデルトレーニングの可能性を示しています。
モデル特徴
小規模で効率的なトレーニング
40GB A100 GPUで約9時間のトレーニングが可能で、VRAM使用量は約30GB
簡素化されたトレーニングプロセス
完全なトレーニングノートブック(train.ipynb)を提供し、再現と実験を容易にします
コンセプト検証設計
高度なコンセプト検証バージョンとして、基本的な機能の実装(簡易キャッシュメカニズムやストーリー生成能力)を示しています
モデル能力
子供向けストーリー生成
短いテキスト生成
コンテキストを考慮したテキスト生成
使用事例
教育エンターテインメント
自動生成された子供向けストーリー
子供向けに年齢に適した短編ストーリーを即座に生成
子供の認知レベルに合った簡単なストーリーを生成
教育アプリケーションのプロトタイプ開発
教育アプリのテキスト生成コンポーネントとしてのプロトタイプ
教育分野における小規模言語モデルの応用可能性を示す
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98