Spec-T1-RL-7Bオープンソース大規模言語モデル - 無料デプロイで数学的推論とコード生成をサポート

ホーム

Spec T1 RL 7B

SVECTOR-CORPORATIONによって開発

Spec-T1-RL-7Bは、数学的推論、アルゴリズム問題の解決、コード生成に特化した高精度の大規模言語モデルで、技術ベンチマークテストで卓越した性能を発揮します。

大規模言語モデル

Safetensors

英語オープンソースライセンス:MIT #数学的推論 #アルゴリズムの最適化 #コード生成

ダウンロード数 4,626

リリース時間 : 5/3/2025

モデル概要

このモデルは、最適化されたアーキテクチャ設計と三段階のトレーニングプロセスにより、数学的推論、アルゴリズム設計、コード生成など、正確な論理思考が必要な分野で同類のモデルを上回る性能を発揮します。

モデル特徴

数学的推論能力

段階的な論理的導出により複雑な数学問題を解決し、組み込みの記号検証メカニズムを備えています。

アルゴリズム設計の最適化

複数の分野で効率的にアルゴリズムを設計および分析し、最適化された解決策を提供します。

高品質のコード生成

機能が完全でテスト合格率の高いコードを生成し、複数のプログラミング言語をサポートします。

正確な指令遵守

構造化された技術的な指示に正確に応答し、論理的な一貫性を保ちます。

効率的なアーキテクチャ設計

混合専門家アーキテクチャと最適化された注意力機構を採用し、70億パラメータ規模で効率的な推論を実現します。

モデル能力

数学的証明の導出

アルゴリズムの設計と分析

プログラミングコードの生成

論理問題の解決

技術文書の理解

使用事例

教育研究

数学問題の解決

学生が複雑な数学概念を理解するのを支援し、段階的な解決過程を提供します。

MATH - 500ベンチマークテストで96.1%の合格率を達成しました。

アルゴリズムの教育支援

アルゴリズムの例を生成し、その動作原理と複雑度分析を説明します。

ソフトウェア開発

コードの自動生成

要件の説明に基づいて機能が完全なコード実装を生成します。

LiveCodeBench v5テストで60.2%の合格率を達成しました。

アルゴリズム実装の最適化

特定の問題に対して最適化されたアルゴリズム実装方案を提供します。

技術研究

数学定理の証明

研究者が形式的な数学的証明を行うのを支援します。

AIME 2025テストで68.3%の合格率を達成しました。

🚀 Spec-T1-RL-7B

高精度な数学的およびアルゴリズム的推論モデルです。このモデルは、数学的推論、アルゴリズムの問題解決、実世界のコード生成に特化しており、専門分野での高精度なロジック思考に最適化されています。

📋 モデルカード

プロパティ	詳細
開発者	SVECTOR
モデルサイズ	70億パラメータ
コンテキスト長	32,000トークン
学習データ	数学、論理、コード内容を中心とした推論に特化したデータセット
精度	`bfloat16`, `float16`
ライセンス	MIT
リリース日	2025年5月

🌟 モデル概要

Spec-T1-RL-7Bは、数学的推論、アルゴリズムの問題解決、実世界のコード生成において卓越した性能を発揮するように設計された特殊な大規模言語モデルです。汎用モデルとは異なり、Spec-T1は正確な論理的思考を必要とする分野で優れた性能を発揮するようにアーキテクチャが設計され、学習されています。このモデルは、70億パラメータ規模での特殊な推論能力において大きな進歩を示しており、技術的なベンチマークでははるかに大きなモデルを上回り、効率的なデプロイメント要件を維持しています。

✨ 主な機能

数学的推論: 複雑な数学問題を段階的な論理的推論で解くことができます。
アルゴリズムの問題解決: 複数のドメインにわたるアルゴリズムの設計と分析が可能です。
コード生成: 機能的で高品質なコードを生成し、高いテスト合格率を達成します。
正確な指示に従う: 構造化された技術的なプロンプトに正確に応答します。
記号的検証: 数学と論理のための組み込み検証メカニズムを使用します。

🏗️ モデルアーキテクチャ

Spec-T1-RL-7Bは、特殊な推論能力を実現するためにいくつかのアーキテクチャ上の革新を組み合わせています。

基礎: 最適化されたアテンションメカニズムを備えた高度なトランスフォーマーアーキテクチャ
エキスパート混合 (MoE): 効率的なスケーリングのための軽量な条件付き計算
活性化関数: 数学演算における勾配の流れを改善するためのSwiGLU活性化関数
正規化: 推論タスクにおけるより速い収束と安定性のためのRMSNorm

📈 学習方法

当社のモデルは、推論能力を最適化するために3段階の学習プロセスを経ています。

1段階: 推論意識のある事前学習

数学的表記、論理的構文、コードに重点を置いた特殊なコーパス
構造化された推論パターンを優先するカリキュラム学習アプローチ
数学とプログラミング構文に最適化されたカスタムトークナイザー

2段階: 命令微調整

推論タスクに焦点を当てた40万以上のマルチドメイン、構造化されたプロンプト
ThoughtChainプロンプトと組み合わせたCodeInstruct方法論
検証フィードバックループを備えた合成データ生成

3段階: 強化学習アライメント

数学とコードの正確性のための決定論的な合格/不合格信号を使用した報酬モデリング
生成された解のリアルタイム検証のための単体テスト統合
数学的証明と導出の記号的検証

📊 ベンチマーク性能

Spec-T1-RL-7Bモデルは、推論ベンチマーク全体で卓越した性能を示しており、特に数学とコード生成タスクで顕著です。

一般的な推論

ベンチマーク	GPT-4o-0513	Claude-3.5-Sonnet	OpenAI o1-mini	QwQ-32B	Spec-T1
GPQA Diamond (Pass@1)	49.9	65.0	60.0	54.5	65.1
SuperGPQA (Pass@1)	42.4	48.2	45.2	43.6	52.8
DROP (3-shot F1)	83.7	88.3	83.9	71.2	86.2
MMLU-Pro (EM)	72.6	78.0	80.3	52.0	76.4
IF-Eval (Prompt Strict)	84.3	86.5	84.8	40.4	83.3

数学ベンチマーク

数学

ベンチマーク	GPT-4o-0513	Claude-3.5-Sonnet	OpenAI o1-mini	QwQ-32B	Spec-T1
MATH-500 (Pass@1)	74.6	78.3	90.0	90.6	96.1
AIME 2024 (Pass@1)	9.3	16.0	63.6	50.0	74.5
AIME 2025 (Pass@1)	11.6	7.4	50.7	32.4	68.3

コード生成

ベンチマーク	GPT-4o-0513	Claude-3.5-Sonnet	OpenAI o1-mini	QwQ-32B	Spec-T1
LiveCodeBench v5 (Pass@1)	32.9	38.9	53.8	41.9	60.2
LiveCodeBench v6 (Pass@1)	30.9	37.2	46.8	39.1	54.4

💻 使用例

基本的な使用法 (Transformersを使用)

from transformers import AutoModelForCausalLM, AutoTokenizer

# モデルとトークナイザーをロード
model = AutoModelForCausalLM.from_pretrained("SVECTOR-CORPORATION/Spec-T1-RL-7B")
tokenizer = AutoTokenizer.from_pretrained("SVECTOR-CORPORATION/Spec-T1-RL-7B")

# 数学的推論の例
prompt = """
Prove: The sum of the first n odd numbers is n^2.
"""

inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(inputs, max_new_tokens=512)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

高度な使用法 (生成パラメータを使用)

# アルゴリズム設計の例
prompt = """
Design an efficient algorithm to find the longest increasing subsequence in an array of integers.
"""

# より良い推論のために生成パラメータを設定
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(
    inputs,
    max_new_tokens=1024,
    temperature=0.1,
    top_p=0.95,
    do_sample=True,
    num_return_sequences=1,
    repetition_penalty=1.1
)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

コード生成の例

# コード生成の例
prompt = """
Write a Python function that implements the A* search algorithm for pathfinding.
"""

inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(
    inputs,
    max_new_tokens=2048,
    temperature=0.2,
    top_p=0.9,
    do_sample=True
)

print(tokenizer.decode(outputs[0], skip_special_tokens=True))

🚀 デプロイメント

Spec-T1-RL-7Bは、効率的なアーキテクチャとパラメータ数のため、一般的なハードウェアでのデプロイが可能です。

最小要件

16GB VRAM (bfloat16/float16)
32GBシステムRAM
CUDA対応GPU

推奨構成

最適なパフォーマンスのために24GB以上のVRAM
長いコンテキストアプリケーションのために64GB以上のシステムRAM
NVIDIA A10以上

📚 引用

もしあなたが研究でSpec-T1-RL-7Bを使用する場合は、以下を引用してください。

@misc{svector2025spect1,
  title={Spec-T1-RL-7B: Structured Reasoning through Reinforcement Alignment},
  author={SVECTOR Team},
  year={2025},
}

📄 ライセンス

Spec-T1-RL-7BはMITライセンスの下でリリースされています。

📞 連絡先

質問、フィードバック、または協力に関する問い合わせは、以下の方法でお問い合わせください。

メール: research@svector.co.in
X: @SVECTOR_
GitHub: SVECTOR-CORPORATION

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご