bloom-zh-3b-chat开源多语言对话模型 - 免费部署支持多元场景交流

首页

Bloom Zh 3b Chat

由 ikala 开发

基于Bloom-zh的30亿参数版本，通过人类反馈数据进行微调的多语言对话模型

大型语言模型

Transformers

支持多种语言开源协议:Openrail #多语言对话生成 #长文本处理(5120)#开源社区驱动

下载量 145

发布时间 : 5/7/2023

模型简介

该模型是一个支持英语、中文和日语的多语言对话模型，专门针对对话任务进行了监督微调，适用于生成自然流畅的助手回复。

模型特点

多语言支持

支持英语、中文和日语三种语言的对话生成

长上下文处理

支持长达5120个token的序列长度，适合处理长对话

人类反馈微调

基于Open-Assistant平台收集的人类对话数据进行监督微调

模型能力

多语言文本生成

对话系统

问答系统

故事创作

使用案例

对话系统

智能助手

构建多语言智能助手，回答用户问题

能够生成自然流畅的助手回复

内容创作

故事生成

根据提示创作故事

能够生成连贯的故事内容

🚀 Bloom-3B SFT模型

Bloom-3B SFT模型基于Bloom-zh的30亿参数模型，在人类示范的对话数据上进行了微调。它能够处理英文、中文和日文，为多语言对话场景提供支持。

对话示例

该模型基于Bloom-zh的30亿参数模型，在2023年4月12日前通过https://open-assistant.io/人类反馈网页应用收集的人类示范对话数据上进行了微调。

在序列长度为5120上进行了监督微调。

✨ 主要特性

多语言支持：支持英文、中文和日文，适用于不同语言的对话场景。
微调优化：基于人类示范对话数据进行微调，提升了模型的对话能力。

📦 安装指南

文档未提供安装步骤，故跳过此章节。

💻 使用示例

基础用法

两个特殊标记 <|prompter|> 和 <|assistant|> 分别用于标记用户和助手回复的开始，每个回复以 </s> 标记结束。

输入提示示例：

<|prompter|>What is a meme, and what's the history behind this word?</s><|assistant|>

输入以 <|assistant|> 标记结尾，以提示模型开始生成助手的回复。

📚 详细文档

模型详情

属性	详情
开发者	Open-Assistant贡献者和 iKala
模型类型	基于Transformer的语言模型
支持语言	英文、中文、日文
微调基础模型	ckip-joint/bloom-3b-zh
代码	Open-Assistant/model/model_training
许可证	MEDIATEK RESEARCH许可证 (链接) 和RAIL许可证v1.0 (链接)，非商业用途

基准测试

模型	MMLU	BBH	Humaneval @10
ikala/redpajama-3b-chat	24.6	29.3	4.8
ikala/bloom-zh-3b-chat	31.4	30.2	0.0
llama-7b (参考)	30.9	27.6	10.3

开发详情

基础模型：ckip-joint/bloom-3b-zh
检查点：1个epoch（6000步）
硬件：NVIDIA RTX A6000 x 4

命令：deepspeed trainer_sft.py --configs defaults bloom-zh-3b datasets --num_train_epochs 2 --deepspeed

数据：

datasets:
  - wmt2019_zh-en:
      max_val_set: 1000
      max_train_set: 20000
  - ted_trans_en-ja:
      max_val_set: 1000
      max_train_set: 20000
  - ted_trans_zh-ja:
      max_val_set: 1000
      max_train_set: 20000
  - ikala:
      input_file_path: export_conversation_v4.4.jsonl
      val_split: 0.05
  - dolly15k:
      val_split: 0.05
  - oasst_export:
      lang: "bg,ca,cs,da,de,en,es,fr,hr,hu,it,nl,pl,pt,ro,ru,sl,sr,sv,uk,zh,ja,th,ko"
      input_file_path: 2023-04-12_oasst_release_ready_synth.jsonl.gz
      val_split: 0.05
  - joke
  - gsm8k
  - webgpt

由于使用了内部数据集 ikala，如果您尝试复现，请移除该数据集。

bloom-zh-3b配置：

bloom-zh-3b:
  dtype: fp16
  log_dir: "bloom-zh_3b"
  learning_rate: 8e-6
  model_name: ckip-joint/bloom-3b-zh
  output_dir: bloom_model_v4_3b
  weight_decay: 0.0
  max_length: 5120
  warmup_steps: 2000
  gradient_checkpointing: true
  gradient_accumulation_steps: 32
  per_device_train_batch_size: 1
  per_device_eval_batch_size: 1
  eval_steps: 500
  save_steps: 1000
  num_train_epochs: 8
  save_total_limit: 2
  deepspeed_config: configs/zero3_config_sft.json

零配置：

{
  "fp16": {
    "enabled": "auto",
    "loss_scale": 0,
    "loss_scale_window": 1000,
    "initial_scale_power": 16,
    "hysteresis": 2,
    "min_loss_scale": 1
  },
  "bf16": {
    "enabled": "auto"
  },
  "optimizer": {
    "type": "AdamW",
    "params": {
      "lr": "auto",
      "betas": "auto",
      "eps": "auto",
      "weight_decay": "auto"
    }
  },
  "scheduler": {
    "type": "WarmupDecayLR",
    "params": {
      "warmup_min_lr": "auto",
      "warmup_max_lr": "auto",
      "warmup_num_steps": "auto",
      "warmup_type": "linear",
      "total_num_steps": "auto"
    }
  },
  "zero_optimization": {
    "stage": 3,
    "overlap_comm": true,
    "contiguous_gradients": true,
    "sub_group_size": 1e9,
    "reduce_bucket_size": "auto",
    "stage3_prefetch_bucket_size": "auto",
    "stage3_param_persistence_threshold": "auto",
    "stage3_max_live_parameters": 1e9,
    "stage3_max_reuse_distance": 1e9,
    "stage3_gather_16bit_weights_on_model_save": true
  },
  "gradient_accumulation_steps": "auto",
  "gradient_clipping": "auto",
  "steps_per_print": 2000,
  "train_batch_size": "auto",
  "train_micro_batch_size_per_gpu": "auto",
  "wall_clock_breakdown": false
}