D

Deepseek R1 Chinese Law

corn6によって開発
UnslothとHuggingface TRLライブラリでトレーニングされたLlamaモデル、推論速度が2倍向上
ダウンロード数 74
リリース時間 : 4/3/2025

モデル概要

これは蒸留と最適化を施した8BパラメータのLlamaモデルで、UnslothフレームワークとTRLライブラリを使用してトレーニングされ、テキスト生成タスクに特化しています。

モデル特徴

高効率トレーニング
Unslothフレームワークを使用し、トレーニング速度が2倍向上
4ビット量子化
4ビット量子化技術(BNB-4bit)を採用し、リソース要件を低減
蒸留最適化
deepseek-r1を基にした蒸留版で、性能を維持しながらモデルサイズを縮小

モデル能力

テキスト生成
テキスト推論

使用事例

テキスト生成
コンテンツ作成
記事やストーリーなどのテキストコンテンツを自動生成
対話システム
インテリジェントな対話アシスタントを構築
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase