Hebrew-Gemma-11B开源大语言模型 - 免费实现希伯来语/英语文本生成

首页

Hebrew Gemma 11B

由 yam-peleg 开发

基于谷歌Gemma-7B架构的开源大语言模型，专为希伯来语/英语生成文本预训练，拥有110亿参数。

大型语言模型

Transformers

支持多种语言开源协议:其他 #希伯来语生成 #110亿参数大模型 #双语混合训练

下载量 69

发布时间 : 3/6/2024

模型简介

希伯来语-Gemma-11B是一个开源的大语言模型，基于谷歌的Gemma-7B架构，专为希伯来语和英语生成文本预训练。该模型在gemma-7b的基础上继续预训练，扩展至更大规模，并额外训练了30亿个英语和希伯来语文本数据标记。

模型特点

多语言支持

专为希伯来语和英语生成文本优化，支持双语理解和生成。

大规模预训练

在gemma-7b基础上继续预训练，额外训练了30亿个英语和希伯来语文本数据标记。

开源模型

作为开源模型，用户可以自由使用和修改，受谷歌原始许可证和使用条款约束。

模型能力

希伯来语文本生成

英语文本生成

自然语言理解

使用案例

自然语言处理

希伯来语内容创作

生成希伯来语文章、故事或其他文本内容。

双语对话系统

构建支持希伯来语和英语的对话系统。

🚀 希伯来语Gemma-11B模型

希伯来语Gemma-11B是一个开源的大语言模型（LLM），是一个拥有110亿参数的希伯来语/英语预训练生成式文本模型，基于谷歌的Gemma-7B架构。它在Gemma-7B的基础上继续预训练，扩展到更大规模，并在30亿额外的英语和希伯来语文本数据上进行训练。由此得到的Gemma-11B模型是一个强大的通用语言模型，适用于广泛的自然语言处理任务，尤其专注于希伯来语的理解和生成。

🚀 快速开始

首先确保执行 pip install -U transformers，然后根据你的使用场景复制相应的代码片段。

✨ 主要特性

基于谷歌的Gemma-7B架构，拥有110亿参数。
在英语和希伯来语的30亿额外文本数据上进行继续预训练。
适用于广泛的自然语言处理任务，专注于希伯来语理解和生成。

📦 安装指南

使用前请确保安装最新的 transformers 库：

pip install -U transformers

💻 使用示例

基础用法

在CPU上运行

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B")

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))

在GPU上运行

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B", device_map="auto")

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))

高级用法

使用4位精度运行

from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B", quantization_config = BitsAndBytesConfig(load_in_4bit=True))

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))