Strela开源语言模型 - 低性能设备适用，兼顾响应速度与回答质量

首页

Strela

由 gai-labs 开发

专为低性能设备优化的高性能语言模型，兼具响应速度与回答质量

大型语言模型

Transformers

支持多种语言#低性能设备优化 #双语对话生成 #轻量级文本创作

下载量 104

发布时间 : 6/4/2024

模型简介

一款专注于自然语言处理的AI模型，擅长对话交互、文本创作和双语翻译，特别优化了在资源受限设备上的运行效率

模型特点

低资源优化

专门针对低性能设备进行优化，保持高效运行

双语支持

同时支持俄语和英语处理

多功能应用

覆盖对话、创作、翻译等多种文本处理场景

模型能力

对话聊天机器人

故事创作

歌词生成

俄英双语互译

文本理解与分析

使用案例

人机交互

智能客服

构建响应迅速的对话机器人

在低配设备上实现流畅交互体验

内容创作

故事生成

根据提示自动生成连贯的叙事文本

可创作多种风格的故事内容

歌词创作

生成符合韵律要求的歌词文本

支持不同音乐风格的歌词产出

语言服务

实时翻译

俄语与英语之间的双向翻译

在资源有限环境下保持翻译质量

🚀 斯特雷拉语言模型

斯特雷拉是一款强大的语言模型，专为在性能较弱的设备上实现高速运行和高质量回答而设计。它适用于多种场景，如聊天机器人对话、故事创作、歌曲编写、俄英互译等，尤其在使用大型模型效率不高的情况下，斯特雷拉能发挥出色的作用。

🚀 快速开始

在线体验模型

你可以点击此处在线体验斯特雷拉模型。

在应用中使用模型进行聊天

推荐使用 GTP4ALL，它支持 GGUF 格式，因此你需要下载 GGUF 格式的特殊版本模型。

在 Unity 中使用模型进行聊天

推荐使用 LLM for Unity，它支持 GGUF 格式，所以你要下载 GGUF 格式的特殊版本模型。

在 Python 中使用量化模型进行聊天（推荐）

你需要安装 gpt4all：

pip install gpt4all

然后，下载 GGUF 版本的模型，并将文件移动到你的脚本目录：

# 导入库
import os
from gpt4all import GPT4All

# 从当前目录中的 strela-q4_k_m.gguf 文件初始化模型
model = GPT4All(model_name='strela-q4_k_m.gguf', model_path=os.getcwd())


# 如果斯特雷拉生成的符号为 '#'（角色声明的开始），则停止生成的函数
def stop_on_token_callback(token_id, token_string):
    if '#' in token_string:
        return False
    else:
        return True


# 系统提示
system_template = """### System:
You are an AI assistant who gives a helpfull response to whatever human ask of you.
"""

# 人类和 AI 的提示
prompt_template = """
### Human:
{0}
### Assistant:
"""

# 聊天会话
with model.chat_session(system_template, prompt_template):
    print("要退出，请输入 '退出'")
    while True:
        print('')
        user_input = input(">>> ")
        if user_input.lower() != "退出":

            # 流式生成
            for token in model.generate(user_input, streaming=True, callback=stop_on_token_callback):
                print(token, end='')
        else:
            break

要退出，请输入 '退出'

>>> 你好
您好！今天我能为您提供什么帮助？
>>>

在 Python 中使用完整模型进行聊天

# 导入库
from transformers import AutoTokenizer, AutoModelForCausalLM

# 加载模型
tokenizer = AutoTokenizer.from_pretrained("gai-labs/strela")
model = AutoModelForCausalLM.from_pretrained("gai-labs/strela")

# 系统提示
system_prompt = "You are an AI assistant who gives a helpfull response to whatever human ask of you."

# 你的提示
prompt = "你好！"

# 聊天模板
chat = f"""### System:
{system_prompt}
### Human:
{prompt}
### Assistant:
"""

# 生成
model_inputs = tokenizer([chat], return_tensors="pt")
generated_ids = model.generate(**model_inputs, max_new_tokens=64) # 设置生成的最大令牌数
output = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

# 从聊天模板中清理输出
output = output.replace(chat, "")

# 输出生成结果
print(output)

你好！有什么可以帮到你的？

在 Python 中使用模型生成文本

# 导入库
from transformers import AutoTokenizer, AutoModelForCausalLM

# 加载模型
tokenizer = AutoTokenizer.from_pretrained("gai-labs/strela")
model = AutoModelForCausalLM.from_pretrained("gai-labs/strela")

# 提示
prompt = "人工智能 - "

# 生成
model_inputs = tokenizer([prompt], return_tensors="pt")
generated_ids = model.generate(**model_inputs, max_new_tokens=64) # 设置生成的最大令牌数
output = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

# 输出生成结果
print(output)

人工智能 - 是计算机科学和技术的一个领域，致力于创造能够“理解”人类或执行与人类类似逻辑任务的机器。

✨ 主要特性

斯特雷拉模型适用于以下场景：

聊天机器人对话
故事创作
歌曲编写
俄英互译
在使用大型模型效率不高的场景

📚 详细文档

斯特雷拉自述

我是一个计算机程序，专为处理和分析自然语言而开发。我具备理解、分析和处理自然语言的能力，这使我能够通过各种通信渠道与人类交流。我的主要目标是帮助人们解决问题，并根据需求提供信息。我可用于多种目的，包括自动文本生成、语言翻译，甚至创作诗歌和歌曲。

📄 许可证

本项目采用 CC BY-SA 4.0 许可证。

英文版本

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库