SambaLingo-Russian-Chat开源对话模型 - 支持俄英双语交流，免费使用！

首页

Sambalingo Russian Chat

由 sambanovasystems 开发

基于俄语和英语训练的人类对齐对话模型，采用直接偏好优化方法训练而成，支持俄英双语对话。

大型语言模型

Transformers

支持多种语言#俄英双语对话 #直接偏好优化 #文化内容生成

下载量 389

发布时间 : 2/15/2024

模型简介

该模型是在SambaLingo-俄语基础版之上，通过直接偏好优化方法训练而成的人类对齐对话模型，专为俄语和英语对话场景优化。

模型特点

双语支持

同时支持俄语和英语的高质量对话生成

人类对齐优化

通过直接偏好优化(DPO)方法训练，使模型输出更符合人类偏好

扩展词汇表

新增25,000个非重叠语言token，显著提升俄语处理能力

模型能力

俄语文本生成

英语文本生成

多轮对话

内容续写

问答系统

使用案例

教育

文学分析辅助

帮助学生分析俄罗斯文学作品

如示例中展示的《罪与罚》人物分析

客服

多语言客服机器人

为俄语和英语用户提供自动客服支持

🚀 SambaLingo-Russian-Chat

SambaLingo-Russian-Chat是一个经过人类对齐的聊天模型，支持俄语和英语。它基于基础模型进行训练，能有效处理多语言对话，为用户提供准确且自然的交互体验。

🚀 快速开始

使用Hugging Face加载模型

请确保在加载分词器时设置use_fast=False。

from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("sambanovasystems/SambaLingo-Russian-Chat", use_fast=False)
model = AutoModelForCausalLM.from_pretrained("sambanovasystems/SambaLingo-Russian-Chat", device_map="auto", torch_dtype="auto")

与模型管道进行交互

请确保在加载分词器时设置use_fast=False。

from transformers import pipeline
pipe = pipeline("text-generation", model="sambanovasystems/SambaLingo-Russian-Chat", device_map="auto", use_fast=False)
messages = [
                {"role": "user", "content": {YOUR_QUESTION}},
]
prompt = pipe.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
outputs = pipe(prompt)[0]
outputs = outputs["generated_text"]

建议的推理参数

温度（Temperature）：0.8
重复惩罚（Repetition penalty）：1.0
核采样概率（Top-p）：0.9

提示模板

要使用此模型，请使用以下聊天模板：

<|user|>\n{question}</s>\n<|assistant|>\n

提示示例与生成结果

<|user|>
Завершите параграф: Родион Раскольников - главный персонаж романа "Преступление и наказание" Федора Достоевского. Его характер очень сложен и     эволюционирует на протяжении всей истории. Он обладает выдающимися умственными способностями и амбициями, но</s>
<|assistant|>
его внутренняя бор    ьба и моральные сомнения мешают ему действовать в соответствии со своими желаниями. Раскольников — бедный студент, который терпит финансовые трудности и чувствует себ    я бессильным изменить свою жизнь. Он приходит к теории, согласно которой некоторые люди имеют право совершать преступления ради достижения великих целей, и решает про    верить свою теорию, убив старуху-процентщицу. Однако его действия приводят к глубокому чувству вины и психологическому срыву, который заставляет его искать искупления     и искупления. На протяжении всего романа Раскольников проходит путь самопознания и личностного роста, осознавая важность сочувствия, сострадания и ответственности пе    ред другими. В конечном итоге он принимает на себя ответственность за свои действия и находит искупление через раскаяние и прощение.

✨ 主要特性

多语言支持：支持俄语和英语，能够在两种语言间自然切换。
人类对齐：经过训练，能生成符合人类期望和道德规范的回复。
遵循特定训练流程：在对齐阶段遵循Zephyr - 7B的训练配方，包括监督微调（SFT）和直接性能优化（DPO）两个阶段。

📦 安装指南

文档未提及具体安装步骤，可参考快速开始部分的模型加载代码。

📚 详细文档

模型描述

开发者：SambaNova Systems
模型类型：语言模型
支持语言：俄语、英语
微调基础模型：Llama - 2 - 7b
试用模型：SambaLingo - chat - space
相关论文：SambaLingo: Teaching Large Language Models New Languages
博客文章：sambalingo - open - source - language - experts

训练详情

对齐阶段遵循Zephyr - 7B的配方，包括两个阶段：监督微调（SFT）和直接性能优化（DPO）。

SFT阶段：在ultrachat_200k数据集和其谷歌翻译版本的混合数据集上进行。训练一个epoch，全局批量大小为512，最大序列长度为2048个标记。使用线性衰减学习率2e - 5和10%的热身。
DPO阶段：在ultrafeedback数据集和cai - conversation - harmless数据集上进行，混合了10%的谷歌翻译数据。训练三个epoch，全局批量大小为32。使用线性衰减学习率5e - 7，10%的热身，DPO的正则化因子β = 0.1。

分词器详情

通过从新语言中添加多达25,000个非重叠标记，将基础Llama模型的词汇量从32,000个标记扩展到57,000个标记。

评估

评估结果请参考论文：SambaLingo: Teaching Large Language Models New Languages

使用方式

直接使用

使用此模型受Meta的Llama 2社区许可协议约束。请在下载模型权重前查看并接受许可协议。

超出适用范围的使用

SambaLingo不应用于以下场景：

关键任务应用
涉及他人安全的应用
做出极其重要决策的场景

偏差、风险和局限性

像所有大语言模型一样，SambaLingo存在一定的局限性：

幻觉问题：模型有时可能生成看似合理但事实错误或无关的信息。
语言切换：模型可能在单个回复中无意地在语言或方言之间切换，影响输出的连贯性和可理解性。
重复问题：模型可能会产生重复的短语或句子，导致回复的吸引力和信息量降低。
编码和数学能力：模型在生成准确代码或解决复杂数学问题方面的性能可能有限。
毒性问题：模型可能无意中生成包含不适当或有害内容的回复。

致谢

我们衷心感谢开源AI社区；没有开源，这项工作将无法完成。SambaNova支持开源社区，并希望积极为这一倡议做出贡献。

我们特别感谢以下团体：

Meta开源了LLama 2和FLORES - 200数据集
Nguyen等人开源了CulturaX数据集
CohereAI发布了AYA - 101并开源了多语言指令调优数据集
EleutherAI提供了开源评估框架
Hugging Face - H4团队开源了zephyr训练配方和对齐手册仓库

引用SambaLingo

@misc{csaki2024sambalingo,
      title={SambaLingo: Teaching Large Language Models New Languages}, 
      author={Zoltan Csaki and Bo Li and Jonathan Li and Qiantong Xu and Pian Pawakapan and Leon Zhang and Yun Du and Hengyu Zhao and Changran Hu and Urmish Thakker},
      year={2024},
      eprint={2404.05829},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}