SambaLingo-Russian-Chat開源對話模型 - 支持俄英雙語交流，免費使用！

首頁

Sambalingo Russian Chat

由sambanovasystems開發

基於俄語和英語訓練的人類對齊對話模型，採用直接偏好優化方法訓練而成，支持俄英雙語對話。

大型語言模型

Transformers

支持多種語言#俄英雙語對話 #直接偏好優化 #文化內容生成

下載量 389

發布時間 : 2/15/2024

模型概述

該模型是在SambaLingo-俄語基礎版之上，通過直接偏好優化方法訓練而成的人類對齊對話模型，專為俄語和英語對話場景優化。

模型特點

雙語支持

同時支持俄語和英語的高質量對話生成

人類對齊優化

通過直接偏好優化(DPO)方法訓練，使模型輸出更符合人類偏好

擴展詞彙表

新增25,000個非重疊語言token，顯著提升俄語處理能力

模型能力

俄語文本生成

英語文本生成

多輪對話

內容續寫

問答系統

使用案例

教育

文學分析輔助

幫助學生分析俄羅斯文學作品

如示例中展示的《罪與罰》人物分析

客服

多語言客服機器人

為俄語和英語用戶提供自動客服支持

🚀 SambaLingo-Russian-Chat

SambaLingo-Russian-Chat是一個經過人類對齊的聊天模型，支持俄語和英語。它基於基礎模型進行訓練，能有效處理多語言對話，為用戶提供準確且自然的交互體驗。

🚀 快速開始

使用Hugging Face加載模型

請確保在加載分詞器時設置use_fast=False。

from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("sambanovasystems/SambaLingo-Russian-Chat", use_fast=False)
model = AutoModelForCausalLM.from_pretrained("sambanovasystems/SambaLingo-Russian-Chat", device_map="auto", torch_dtype="auto")

與模型管道進行交互

請確保在加載分詞器時設置use_fast=False。

from transformers import pipeline
pipe = pipeline("text-generation", model="sambanovasystems/SambaLingo-Russian-Chat", device_map="auto", use_fast=False)
messages = [
                {"role": "user", "content": {YOUR_QUESTION}},
]
prompt = pipe.tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
outputs = pipe(prompt)[0]
outputs = outputs["generated_text"]

建議的推理參數

溫度（Temperature）：0.8
重複懲罰（Repetition penalty）：1.0
核採樣概率（Top-p）：0.9

提示模板

要使用此模型，請使用以下聊天模板：

<|user|>\n{question}</s>\n<|assistant|>\n

提示示例與生成結果

<|user|>
Завершите параграф: Родион Раскольников - главный персонаж романа "Преступление и наказание" Федора Достоевского. Его характер очень сложен и     эволюционирует на протяжении всей истории. Он обладает выдающимися умственными способностями и амбициями, но</s>
<|assistant|>
его внутренняя бор    ьба и моральные сомнения мешают ему действовать в соответствии со своими желаниями. Раскольников — бедный студент, который терпит финансовые трудности и чувствует себ    я бессильным изменить свою жизнь. Он приходит к теории, согласно которой некоторые люди имеют право совершать преступления ради достижения великих целей, и решает про    верить свою теорию, убив старуху-процентщицу. Однако его действия приводят к глубокому чувству вины и психологическому срыву, который заставляет его искать искупления     и искупления. На протяжении всего романа Раскольников проходит путь самопознания и личностного роста, осознавая важность сочувствия, сострадания и ответственности пе    ред другими. В конечном итоге он принимает на себя ответственность за свои действия и находит искупление через раскаяние и прощение.

✨ 主要特性

多語言支持：支持俄語和英語，能夠在兩種語言間自然切換。
人類對齊：經過訓練，能生成符合人類期望和道德規範的回覆。
遵循特定訓練流程：在對齊階段遵循Zephyr - 7B的訓練配方，包括監督微調（SFT）和直接性能優化（DPO）兩個階段。

📦 安裝指南

文檔未提及具體安裝步驟，可參考快速開始部分的模型加載代碼。

📚 詳細文檔

模型描述

開發者：SambaNova Systems
模型類型：語言模型
支持語言：俄語、英語
微調基礎模型：Llama - 2 - 7b
試用模型：SambaLingo - chat - space
相關論文：SambaLingo: Teaching Large Language Models New Languages
博客文章：sambalingo - open - source - language - experts

訓練詳情

對齊階段遵循Zephyr - 7B的配方，包括兩個階段：監督微調（SFT）和直接性能優化（DPO）。

SFT階段：在ultrachat_200k數據集和其谷歌翻譯版本的混合數據集上進行。訓練一個epoch，全局批量大小為512，最大序列長度為2048個標記。使用線性衰減學習率2e - 5和10%的熱身。
DPO階段：在ultrafeedback數據集和cai - conversation - harmless數據集上進行，混合了10%的谷歌翻譯數據。訓練三個epoch，全局批量大小為32。使用線性衰減學習率5e - 7，10%的熱身，DPO的正則化因子β = 0.1。

分詞器詳情

通過從新語言中添加多達25,000個非重疊標記，將基礎Llama模型的詞彙量從32,000個標記擴展到57,000個標記。

評估

評估結果請參考論文：SambaLingo: Teaching Large Language Models New Languages

使用方式

直接使用

使用此模型受Meta的Llama 2社區許可協議約束。請在下載模型權重前查看並接受許可協議。

超出適用範圍的使用

SambaLingo不應用於以下場景：

關鍵任務應用
涉及他人安全的應用
做出極其重要決策的場景

偏差、風險和侷限性

像所有大語言模型一樣，SambaLingo存在一定的侷限性：

幻覺問題：模型有時可能生成看似合理但事實錯誤或無關的信息。
語言切換：模型可能在單個回覆中無意地在語言或方言之間切換，影響輸出的連貫性和可理解性。
重複問題：模型可能會產生重複的短語或句子，導致回覆的吸引力和信息量降低。
編碼和數學能力：模型在生成準確代碼或解決複雜數學問題方面的性能可能有限。
毒性問題：模型可能無意中生成包含不適當或有害內容的回覆。

致謝

我們衷心感謝開源AI社區；沒有開源，這項工作將無法完成。SambaNova支持開源社區，並希望積極為這一倡議做出貢獻。

我們特別感謝以下團體：

Meta開源了LLama 2和FLORES - 200數據集
Nguyen等人開源了CulturaX數據集
CohereAI發佈了AYA - 101並開源了多語言指令調優數據集
EleutherAI提供了開源評估框架
Hugging Face - H4團隊開源了zephyr訓練配方和對齊手冊倉庫

引用SambaLingo

@misc{csaki2024sambalingo,
      title={SambaLingo: Teaching Large Language Models New Languages}, 
      author={Zoltan Csaki and Bo Li and Jonathan Li and Qiantong Xu and Pian Pawakapan and Leon Zhang and Yun Du and Hengyu Zhao and Changran Hu and Urmish Thakker},
      year={2024},
      eprint={2404.05829},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}