Teuken-7B-instruct-research-v0.4-Q6_K-GGUF开源模型

首页

Teuken 7B Instruct Research V0.4 Q6 K GGUF

由 lukasfast 开发

该模型是基于openGPT-X/Teuken-7B-instruct-research-v0.4转换的GGUF格式版本，支持多语言文本生成任务。

大型语言模型支持多种语言开源协议:其他 #多语言指令生成 #欧洲语言优化 #轻量化部署

下载量 36

发布时间 : 1/22/2025

模型简介

Teuken-7B是一个多语言指令微调的研究模型，支持24种欧洲语言的文本生成任务。

模型特点

多语言支持

支持24种欧洲语言的文本生成任务

GGUF格式

采用GGUF格式优化，便于在llama.cpp生态中使用

指令微调

经过指令微调，适合研究用途

模型能力

多语言文本生成

指令跟随

研究用途文本生成

使用案例

学术研究

多语言文本生成研究

用于比较不同语言模型在多语言环境下的表现

内容创作

多语言内容生成

为不同语言用户自动生成内容

🚀 lukasfast/Teuken-7B-instruct-research-v0.4-Q6_K-GGUF

本模型是使用llama.cpp，通过ggml.ai的GGUF-my-repo空间，从openGPT-X/Teuken-7B-instruct-research-v0.4转换为GGUF格式的。有关该模型的更多详细信息，请参考原始模型卡片。

🚀 快速开始

本模型支持多种语言和评估指标，以下是详细信息：

属性	详情
支持语言	de、bg、cs、da、el、en、es、et、fi、fr、ga、hr、hu、it、lt、lv、mt、nl、pl、pt、ro、sl、sv、sk
评估指标	accuracy、bleu
任务类型	文本生成
库名称	transformers
基础模型	openGPT-X/Teuken-7B-instruct-research-v0.4
许可证	other
标签	llama-cpp、gguf-my-repo

📦 安装指南

使用brew安装llama.cpp（适用于Mac和Linux）

brew install llama.cpp

💻 使用示例

使用llama.cpp的CLI进行推理

llama-cli --hf-repo lukasfast/Teuken-7B-instruct-research-v0.4-Q6_K-GGUF --hf-file teuken-7b-instruct-research-v0.4-q6_k.gguf -p "The meaning to life and the universe is"

使用llama.cpp的服务器进行推理

llama-server --hf-repo lukasfast/Teuken-7B-instruct-research-v0.4-Q6_K-GGUF --hf-file teuken-7b-instruct-research-v0.4-q6_k.gguf -c 2048

直接使用Llama.cpp仓库中的步骤进行推理

步骤1：从GitHub克隆llama.cpp仓库

git clone https://github.com/ggerganov/llama.cpp

步骤2：进入llama.cpp文件夹并使用`LLAMA_CURL=1`标志以及其他特定硬件标志进行编译（例如，在Linux上使用Nvidia GPU时使用`LLAMA_CUDA=1`）

cd llama.cpp && LLAMA_CURL=1 make

步骤3：通过主二进制文件运行推理

./llama-cli --hf-repo lukasfast/Teuken-7B-instruct-research-v0.4-Q6_K-GGUF --hf-file teuken-7b-instruct-research-v0.4-q6_k.gguf -p "The meaning to life and the universe is"

或者

./llama-server --hf-repo lukasfast/Teuken-7B-instruct-research-v0.4-Q6_K-GGUF --hf-file teuken-7b-instruct-research-v0.4-q6_k.gguf -c 2048

⚠️ 重要提示

你也可以直接通过Llama.cpp仓库中列出的使用步骤使用此检查点。

📄 许可证

本模型使用的许可证为other。

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库