Cymist2-v01-SFT開源語言模型 - 免費部署助力土英雙語高效文本生成

首頁

Cymist2 V01 SFT

由cypienai開發

Cymist2-v0.1是由Cypien AI團隊開發的先進語言模型，專為土耳其語和英語的文本生成任務優化，支持檢索增強生成(RAG)和監督微調(SFT)。

大型語言模型

Transformers

支持多種語言開源協議:Apache-2.0 #土耳其語生成 #RAG增強 #多語言對話

下載量 2,729

發布時間 : 5/12/2024

模型概述

基於Mistral-7B架構優化的多語言文本生成模型，適用於通用任務和擬人化交互場景。

模型特點

多語言支持

專門優化土耳其語處理能力，同時支持英語文本生成

檢索增強生成

集成RAG技術提升生成內容的相關性和準確性

高效推理

支持Flash-Attention 2加速技術，提高生成效率

模型能力

土耳其語文本生成

英語文本生成

檢索增強生成

對話系統構建

使用案例

對話系統

土耳其語聊天機器人

構建能自然處理土耳其語的對話助手

內容生成

多語言內容創作

生成土耳其語和英語的營銷文案或文章

🚀 Cymist2-v0.1-SFT模型卡片

Cymist2-v0.1-SFT是一款前沿的語言模型，由Cypien AI團隊開發，專為文本生成任務進行了優化。該模型藉助transformers庫構建，並遵循Apache-2.0許可證開源。

🚀 快速開始

新版本發佈

cymist-2-v02-SFT

✨ 主要特性

模型描述

開發團隊：Cypien AI團隊
模型類型：文本生成語言模型
支持語言：土耳其語、英語
許可證：Apache-2.0
微調基礎模型：mistralai/Mistral-7B-v0.1

直接使用場景

此模型適用於需要理解土耳其語、具備檢索增強生成（RAG）和文本生成能力的通用應用程序。它可以集成到聊天機器人、虛擬助手和其他需要理解並生成類人回覆的人工智能系統中。

不適用場景

該模型不適用於可能因錯誤答案導致危害的關鍵系統，或需要超出通用文本生成範圍的特定領域知識的場景。

📦 安裝指南

文檔未提及具體安裝步驟，可參考transformers庫的官方安裝說明。

💻 使用示例

基礎用法

from transformers import AutoModelForCausalLM, AutoTokenizer

model_name = "cypienai/cymist2-v01-SFT"
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.bfloat16)
tokenizer = AutoTokenizer.from_pretrained(model_name)
tokenizer.pad_token_id = tokenizer.eos_token_id

高級用法

使用Flash-Attention 2進一步加速生成：

model = AutoModelForCausalLM.from_pretrained(
        model_name,
        torch_dtype=torch.bfloat16,
        attn_implementation="flash_attention_2"
        )

示例用法

question="Yenilenebilir gıdalar nelerdir ?"
prompt= f"[INST] {question} [/INST]"

with torch.inference_mode():
  input_ids = tokenizer(prompt, return_tensors="pt").to(device)
  output = model.generate(**input_ids, max_new_tokens=8096)
  decoded_output = tokenizer.decode(output[0], skip_special_tokens=False)
  print(decoded_output)