Strela開源語言模型 - 低性能設備適用，兼顧響應速度與回答質量

首頁

Strela

由gai-labs開發

專為低性能設備優化的高性能語言模型，兼具響應速度與回答質量

大型語言模型

Transformers

支持多種語言#低性能設備優化 #雙語對話生成 #輕量級文本創作

下載量 104

發布時間 : 6/4/2024

模型概述

一款專注於自然語言處理的AI模型，擅長對話交互、文本創作和雙語翻譯，特別優化了在資源受限設備上的運行效率

模型特點

低資源優化

專門針對低性能設備進行優化，保持高效運行

雙語支持

同時支持俄語和英語處理

多功能應用

覆蓋對話、創作、翻譯等多種文本處理場景

模型能力

對話聊天機器人

故事創作

歌詞生成

俄英雙語互譯

文本理解與分析

使用案例

人機交互

智能客服

構建響應迅速的對話機器人

在低配設備上實現流暢交互體驗

內容創作

故事生成

根據提示自動生成連貫的敘事文本

可創作多種風格的故事內容

歌詞創作

生成符合韻律要求的歌詞文本

支持不同音樂風格的歌詞產出

語言服務

即時翻譯

俄語與英語之間的雙向翻譯

在資源有限環境下保持翻譯質量

🚀 斯特雷拉語言模型

斯特雷拉是一款強大的語言模型，專為在性能較弱的設備上實現高速運行和高質量回答而設計。它適用於多種場景，如聊天機器人對話、故事創作、歌曲編寫、俄英互譯等，尤其在使用大型模型效率不高的情況下，斯特雷拉能發揮出色的作用。

🚀 快速開始

在線體驗模型

你可以點擊此處在線體驗斯特雷拉模型。

在應用中使用模型進行聊天

推薦使用 GTP4ALL，它支持 GGUF 格式，因此你需要下載 GGUF 格式的特殊版本模型。

在 Unity 中使用模型進行聊天

推薦使用 LLM for Unity，它支持 GGUF 格式，所以你要下載 GGUF 格式的特殊版本模型。

在 Python 中使用量化模型進行聊天（推薦）

你需要安裝 gpt4all：

pip install gpt4all

然後，下載 GGUF 版本的模型，並將文件移動到你的腳本目錄：

# 導入庫
import os
from gpt4all import GPT4All

# 從當前目錄中的 strela-q4_k_m.gguf 文件初始化模型
model = GPT4All(model_name='strela-q4_k_m.gguf', model_path=os.getcwd())


# 如果斯特雷拉生成的符號為 '#'（角色聲明的開始），則停止生成的函數
def stop_on_token_callback(token_id, token_string):
    if '#' in token_string:
        return False
    else:
        return True


# 系統提示
system_template = """### System:
You are an AI assistant who gives a helpfull response to whatever human ask of you.
"""

# 人類和 AI 的提示
prompt_template = """
### Human:
{0}
### Assistant:
"""

# 聊天會話
with model.chat_session(system_template, prompt_template):
    print("要退出，請輸入 '退出'")
    while True:
        print('')
        user_input = input(">>> ")
        if user_input.lower() != "退出":

            # 流式生成
            for token in model.generate(user_input, streaming=True, callback=stop_on_token_callback):
                print(token, end='')
        else:
            break

要退出，請輸入 '退出'

>>> 你好
您好！今天我能為您提供什麼幫助？
>>>

在 Python 中使用完整模型進行聊天

# 導入庫
from transformers import AutoTokenizer, AutoModelForCausalLM

# 加載模型
tokenizer = AutoTokenizer.from_pretrained("gai-labs/strela")
model = AutoModelForCausalLM.from_pretrained("gai-labs/strela")

# 系統提示
system_prompt = "You are an AI assistant who gives a helpfull response to whatever human ask of you."

# 你的提示
prompt = "你好！"

# 聊天模板
chat = f"""### System:
{system_prompt}
### Human:
{prompt}
### Assistant:
"""

# 生成
model_inputs = tokenizer([chat], return_tensors="pt")
generated_ids = model.generate(**model_inputs, max_new_tokens=64) # 設置生成的最大令牌數
output = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

# 從聊天模板中清理輸出
output = output.replace(chat, "")

# 輸出生成結果
print(output)

你好！有什麼可以幫到你的？

在 Python 中使用模型生成文本

# 導入庫
from transformers import AutoTokenizer, AutoModelForCausalLM

# 加載模型
tokenizer = AutoTokenizer.from_pretrained("gai-labs/strela")
model = AutoModelForCausalLM.from_pretrained("gai-labs/strela")

# 提示
prompt = "人工智能 - "

# 生成
model_inputs = tokenizer([prompt], return_tensors="pt")
generated_ids = model.generate(**model_inputs, max_new_tokens=64) # 設置生成的最大令牌數
output = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

# 輸出生成結果
print(output)

人工智能 - 是計算機科學和技術的一個領域，致力於創造能夠“理解”人類或執行與人類類似邏輯任務的機器。

✨ 主要特性

斯特雷拉模型適用於以下場景：

聊天機器人對話
故事創作
歌曲編寫
俄英互譯
在使用大型模型效率不高的場景

📚 詳細文檔

斯特雷拉自述

我是一個計算機程序，專為處理和分析自然語言而開發。我具備理解、分析和處理自然語言的能力，這使我能夠通過各種通信渠道與人類交流。我的主要目標是幫助人們解決問題，並根據需求提供信息。我可用於多種目的，包括自動文本生成、語言翻譯，甚至創作詩歌和歌曲。

📄 許可證

本項目採用 CC BY-SA 4.0 許可證。

英文版本

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫