Superthoughts - lite - v2 - MOE - Llama3.2 - GGUFオープンソースモデル - 推論タスクに適した正確で効率的な選択肢

ホーム

Superthoughts Lite V2 MOE Llama3.2 GGUF

Pinkstackによって開発

Superthoughts Lite v2はLlama-3.2アーキテクチャを基にした軽量な混合専門家(MOE)モデルで、推論タスクに特化し、より高い精度と性能を提供します。

大規模言語モデル複数言語対応#混合専門家推論 #構造化思考生成 #多分野精密対応

ダウンロード数 119

リリース時間 : 5/6/2025

モデル概要

このモデルはチャット、数学、コード、科学推論タスクに適した軽量な推論モデルです。混合専門家(MOE)アーキテクチャにより効率的な推論を実現し、応答生成時のループ現象を減少させます。

モデル特徴

混合専門家アーキテクチャ

4つの専門家モデル（チャット、数学、コード、科学推論）を含み、各推論時に2つの専門家を活性化させ、タスク固有の性能を向上

効率的な推論

GRPO技術とUnsloth微調整により最適化され、より良い性能と少ないループ現象を提供

構造化思考出力

<think>タグ内で段階的な推論プロセスを生成可能で、透明性と説明可能性を向上

長文脈サポート

131072トークンの文脈長をサポートし、複雑なタスク処理に適している

モデル能力

テキスト生成

数学推論

コード生成

科学推論

対話システム

使用事例

教育

数学問題解答

複雑な数学問題を解決し、段階的な推論プロセスを表示することで学生を支援

学習効率と理解深度の向上

プログラミング学習支援

プログラミング概念を説明しサンプルコードを生成

初心者がプログラミングスキルをより早く習得するのを支援

研究

科学概念説明

複雑な科学概念や理論を説明

研究者が分野横断的な知識を迅速に理解するのを支援

🚀 スーパーソートライトv2-MOE-Llama3.2

このモデルは、様々なタスクで高精度な応答を生成し、応答生成時のループを減らした高性能なテキスト生成モデルです。化学、コード、数学などの分野に対応しています。

🚀 クイックスタート

このモデルは、多くのタスクで高精度かつ高性能な応答を生成します。以下のリンクから異なる形式のモデルを利用できます。

superthoughts lite v2 moe logo

✨ 主な機能

高精度：すべてのタスクで高精度な応答を生成します。
高性能：応答生成時のループが少なく、高速に応答を生成します。
多機能：化学、コード、数学などの様々な分野に対応しています。

📚 ドキュメント

モデル情報

プロパティ	詳細
モデルタイプ	テキスト生成
ベースモデル	Pinkstack/Superthoughts-lite-v2-MOE-Llama3.2
パラメータ数	3.91B
アクティブなエキスパート数	2
総エキスパート数	4
生成可能トークン数	16,380
コンテキストサイズ	131072

学習方法

まず、meta-llama/Llama-3.2-1B-Instructの上にUnslothを使用してGRPO技術を用いてベースモデルを作成しました。その後、各潜在的なエキスパートをSFTで学習させ、再度GRPOを行いました。総計4つのエキスパートがあります。

チャット推論エキスパート
数学推論エキスパート
コード推論エキスパート
科学推論エキスパート

システムプロンプト

Thinking: enabled.

Follow this format strictly:
<think>
Write your step-by-step reasoning here.
Break down the problem into smaller parts.
Solve each part systematically.
Check your work and verify the answer makes sense.
</think>
[Your final answer after thinking].

制限事項

セーフティ対策：セーフティアライメントは最小限に行われているため、モデルは時々無修正の応答を生成することがあります。
幻覚問題：すべての大規模言語モデルと同様に、このモデルも幻覚を起こし、誤った情報を出力することがあります。応答を必ず二重チェックしてください。

GGUFテンプレート

{{ if .Messages }}
{{- if or .System .Tools }}<|start_header_id|>system<|end_header_id|>
{{- if .System }}

{{ .System }}
{{- end }}
{{- if .Tools }}

You are a helpful assistant with tool calling capabilities. When you receive a tool call response, use the output to format an answer to the original use question.
{{- end }}
{{- end }}<|eot_id|>
{{- range $i, $_ := .Messages }}
{{- $last := eq (len (slice $.Messages $i)) 1 }}
{{- if eq .Role "user" }}<|start_header_id|>user<|end_header_id|>
{{- if and $.Tools $last }}

Given the following functions, please respond with a JSON for a function call with its proper arguments that best answers the given prompt.

Respond in the format {"name": function name, "parameters": dictionary of argument name and its value}. Do not use variables.

{{ $.Tools }}
{{- end }}

{{ .Content }}<|eot_id|>{{ if $last }}<|start_header_id|>assistant<|end_header_id|>

{{ end }}
{{- else if eq .Role "assistant" }}<|start_header_id|>assistant<|end_header_id|>
{{- if .ToolCalls }}

{{- range .ToolCalls }}{"name": "{{ .Function.Name }}", "parameters": {{ .Function.Arguments }}}{{ end }}
{{- else }}

{{ .Content }}{{ if not $last }}<|eot_id|>{{ end }}
{{- end }}
{{- else if eq .Role "tool" }}<|start_header_id|>ipython<|end_header_id|>

{{ .Content }}<|eot_id|>{{ if $last }}<|start_header_id|>assistant<|end_header_id|>

{{ end }}
{{- end }}
{{- end }}
{{- else }}
{{- if .System }}<|start_header_id|>system<|end_header_id|>

{{ .System }}<|eot_id|>{{ end }}{{ if .Prompt }}<|start_header_id|>user<|end_header_id|>

{{ .Prompt }}<|eot_id|>{{ end }}<|start_header_id|>assistant<|end_header_id|>

{{ end }}{{ .Response }}{{ if .Response }}<|eot_id|>{{ end }}