o1_gigachat - 20b - a3b_ggufオープンソースモデル - 無料でデプロイしてロシア語の論理思考過程をシミュレートする

ホーム

O1 Gigachat 20b A3b Gguf

evilfreelancerによって開発

GigaChat-20B-A3Bモデルを基に訓練されたLoRAアダプターで、ロシア語の論理的思考プロセスをシミュレートするために特別に設計

大規模言語モデル複数言語対応オープンソースライセンス:MIT #ロシア語思考推論 #LoRAファインチューニング #マルチターン対話最適化

ダウンロード数 152

リリース時間 : 1/16/2025

モデル概要

このモデルはLoRAアダプターによりGigaChat-20B-A3Bのロシア語論理思考能力を強化し、OpenAI o1モデルのような思考プロセスを模倣可能。特に推論ステップを表示する必要があるロシア語対話シナリオに最適

モデル特徴

ロシア語論理思考シミュレーション

ロシア語に最適化された思考プロセス表示機能で、指定された形式で推論ステップを出力可能

LoRAファインチューニング

低ランクアダプター技術を使用してベースモデルを効率的に微調整し、元のモデル能力を保持しながら特定機能を追加

構造化出力

<Thought>と<output>タグによる構造化応答をサポートし、推論プロセスと最終回答を明確に分離

モデル能力

ロシア語テキスト生成

論理推論プロセス表示

構造化質問応答

マルチターン対話

使用事例

インテリジェントアシスタント

ロシア語教育アシスタント

学生が複雑な問題の解決プロセスを理解するのを支援

段階的な推論を表示し、学習効果を向上

専門コンサルティング

技術問題診断

技術問題を分析し詳細な解決手順を提供

明確な思考プロセスがユーザーの解決策理解を助ける

🚀 ロシア語版 o1 / GigaChat 20B-A3B Instruct GGUF

このプロジェクトは、GigaChat-20B-A3B モデルのLoRAアダプターです。このアダプターは、Egor-AI/Russian_thinking_dataset データセット（BintangFortuna/OpenO1-SFT-EN-SY データセットのロシア語への機械翻訳）を使用して学習されています。学習されたモデルは、OpenAI の o1 と同様に、ロシア語での論理的な思考を模倣することができます。

モデルの詳細情報はこちらをご覧ください。
W&Bレポートはこちらです。

📦 モデル情報

属性	詳情
モデルタイプ	質問応答
学習データ	Egor-AI/Russian_thinking_dataset
ベースモデル	evilfreelancer/o1_gigachat-20b-a3b_lora
ライセンス	MIT

🚀 クイックスタート

このモデルを使用する際には、以下の形式のシステムプロンプトを使用する必要があります。

あなたはAIアシスタントです。回答を以下の形式で整形してください: <Thought> あなたの考え (理解、推論) </Thought> <output> あなたの回答 </output>

🔧 技術詳細

学習は impruver ユーティリティを使用し、GigaChat/20B-A3B_lora_o1 の設定を用いて行われました。RTX 4090で約117時間かかり、23GBのビデオメモリが必要でした。

以下は学習設定の詳細です。

output_dir: ./models/GigaChat_20B-A3B_lora_thinking
train_path: ./train.GigaChat_20B-A3B_lora_thinking.jsonl
val_path: ./val.GigaChat_20B-A3B_lora_thinking.jsonl

datasets:
  - name: Egor-AI/Russian_thinking_dataset
    converter: impruver.instruction_to_messages
    mapping:
      system: system
      instruction: prompt
      output: response

model:
  class: custom.gigachat.DeepseekForCausalLM
  name: ai-sage/GigaChat-20B-A3B-instruct-bf16
  attn_implementation: flash_attention_2
  load_in_4bit: true
  load_in_8bit: false
  dtype: bf16

lora:
  r: 8
  lora_alpha: 32
  lora_dropout: 0.1
  bias: none
  target_modules: [ q_proj, v_proj, k_proj, o_proj, gate_proj, down_proj, up_proj ]
  task_type: CAUSAL_LM

tokenizer:
  class: transformers.AutoTokenizer
  name: ai-sage/GigaChat-20B-A3B-instruct
  max_tokens_count: 1500
  special_tokens:
    pad_token_id: 1
    pad_token: <s>
    bos_token_id: 1
    bos_token: <s>
    eos_token_id: 128001
    eos_token: <|message_sep|>
  chat_template: >
    {% if messages[0]['role'] == 'system' -%}
        {%- set loop_messages = messages[1:] -%}
        {%- set system_message = bos_token + messages[0]['content'] + additional_special_tokens[1] -%}
    {%- else -%}
        {%- set loop_messages = messages -%}
        {%- set system_message = bos_token + '' -%}
    {%- endif -%}
    {%- for message in messages %}
        {%- if message['role'] == 'system' -%}
            {{ system_message -}}
        {%- endif -%}
        {%- if message['role'] == 'user' -%}
            {{ message['role'] + additional_special_tokens[0] + message['content'] + additional_special_tokens[1] -}}
            {{ 'available functions' + additional_special_tokens[0] + additional_special_tokens[2] + additional_special_tokens[3]  + additional_special_tokens[1] -}}
        {%- endif -%}
        {%- if message['role'] == 'assistant' -%}
            {{ message['role'] + additional_special_tokens[0] + message['content'] + additional_special_tokens[1] -}}
        {%- endif -%}
        {%- if loop.last and add_generation_prompt -%}
            {{ 'assistant' + additional_special_tokens[0] -}}
        {%- endif -%}
    {%- endfor %}

trainer:
  eval_strategy: steps
  save_strategy: steps
  eval_steps: 100
  save_steps: 100
  per_device_train_batch_size: 1
  per_device_eval_batch_size: 1
  gradient_accumulation_steps: 8
  logging_steps: 1
  learning_rate: 0.0004
  num_train_epochs: 2
  lr_scheduler_type: cosine
  warmup_steps: 16
  optim: adamw_torch_4bit
  metric_for_best_model: eval_loss
  load_best_model_at_end: true
  save_total_limit: 2
  seed: 42
  remove_unused_columns: false
  max_grad_norm: 1.0
  weight_decay: 0.08
  torch_compile: false