DeepSeek-R1-Distill-Llama-8Bオープンソース大規模言語モデル - 無料デプロイで英語テキスト生成と理解をサポート

ホーム

Deepseek R1 Distill Llama 8B Abliterated

stepenZENによって開発

DeepSeek-R1-Distill-Llama-8BはLlamaアーキテクチャに基づく蒸留版大規模言語モデルで、パラメータ規模は8B、主に英語テキスト生成と理解タスクに使用されます。

大規模言語モデル

Transformers

英語#蒸留最適化 #英語処理 #効率的な推論

ダウンロード数 119

リリース時間 : 1/20/2025

モデル概要

このモデルはDeepSeekがリリースしたR1シリーズの一つで、蒸留技術を用いてより大規模なモデルから知識を抽出し、高い性能を維持しながら計算リソース要件を削減しています。

モデル特徴

蒸留技術

より大規模なモデルから蒸留技術で知識を抽出し、性能を維持しながらモデル規模を削減。

効率的な推論

8Bパラメータ規模で性能を保ちつつ計算リソース要件を低減し、より多くのアプリケーションシナリオに適しています。

英語最適化

英語テキスト生成と理解タスク向けに最適化されています。

モデル能力

テキスト生成

テキスト理解

質問応答システム

コンテンツ要約

使用事例

コンテンツ生成

記事作成

高品質な英語記事や段落を生成

流暢で一貫性のある英語コンテンツを生成

対話システム

英語チャットボットを構築

自然で流暢な英語対話を実現

テキスト理解

質問応答システム

英語テキストに基づく質問に回答

質問を正確に理解し関連する回答を提供

コンテンツ要約

英語テキストの要約を生成

キー情報を抽出し簡潔な要約を生成

Property	Details
Model Type	DeepSeek-R1-Distill-Llama-8B-Abliterated
Base Model	deepseek-ai/DeepSeek-R1-Distill-Llama-8B
Library Name	transformers

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Deepseek R1 Distill Llama 8B Abliterated

モデル概要

モデル特徴

モデル能力

使用事例

🚀 DeepSeek-R1-Distill-Llama-8B-Abliterated

📚 ドキュメント