Tinyllama V0
T
Tinyllama V0
由Maykeye開發
首個基於Llama架構重構的TinyStories-1M版本,專為生成兒童故事設計的概念驗證模型
下載量 565.95k
發布時間 : 7/8/2023
模型概述
該模型是基於Llama架構重構的TinyStories版本,主要用於生成適合兒童的短篇故事。作為概念驗證項目,展示了在小規模數據集上訓練語言模型的可能性。
模型特點
小規模高效訓練
在40GB A100顯卡上僅需約9小時即可完成訓練,顯存佔用約30GB
簡化訓練流程
提供完整的訓練筆記本(train.ipynb),便於復現和實驗
概念驗證設計
作為高度概念驗證版本,展示了基礎功能的實現,包括簡易緩存機制和故事生成能力
模型能力
兒童故事生成
短文本生成
上下文感知文本生成
使用案例
教育娛樂
自動生成兒童故事
為兒童即時生成適合年齡段的短篇故事
生成符合兒童認知水平的簡單故事
教育應用原型開發
作為教育類應用的文本生成組件原型
展示小規模語言模型在教育領域的應用潛力
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98