D

Deepseek Llm Tiny Random

由yujiepan開發
這是一個基於DeepSeek-LLM-67B-Chat架構的隨機初始化小型模型,採用float16精度,主要用於文本生成任務。
下載量 38
發布時間 : 4/1/2024

模型概述

該模型是DeepSeek-LLM-67B-Chat的縮小版本,保留了原始架構但參數規模大幅減小,適合快速測試和原型開發。

模型特點

小型化設計
基於大型模型架構但大幅縮小規模,適合快速測試
float16精度
採用半精度浮點數,減少內存佔用
兼容DeepSeek架構
保持與DeepSeek-LLM-67B-Chat相同的架構配置

模型能力

中文文本生成
對話系統原型開發

使用案例

開發測試
模型架構驗證
用於驗證DeepSeek架構在小規模下的表現
可快速驗證架構設計可行性
原型開發
為大型語言模型應用開發提供快速原型環境
加速開發流程
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase