Hebrew-Gemma-11B-V2開源大語言模型 - 支持希伯來語/英語文本生成

首頁

Hebrew Gemma 11B V2

由yam-peleg開發

Hebrew-Gemma-11B-V2 是一個開源的希伯來語/英語預訓練生成文本大語言模型，擁有110億參數，基於Google的Gemma-7B架構。

大型語言模型

Transformers

支持多種語言開源協議:其他 #希伯來語生成 #多語言大模型 #110億參數

下載量 5,292

發布時間 : 3/16/2024

模型概述

該模型是對gemma-7b的繼續預訓練，擴展至更大規模，並在30億額外英語和希伯來語文本數據上進行了訓練。適用於廣泛的自然語言處理任務，尤其專注於希伯來語的理解和生成。

模型特點

多語言支持

支持希伯來語和英語的雙語文本生成和理解。

大規模預訓練

在30億額外英語和希伯來語文本數據上進行了訓練，增強了語言理解和生成能力。

高性能

基於Google的Gemma-7B架構，擁有110億參數，提供強大的語言處理能力。

模型能力

文本生成

希伯來語理解

英語理解

自然語言處理

使用案例

自然語言處理

希伯來語文本生成

生成高質量的希伯來語文本，適用於內容創作、翻譯等場景。

英語文本生成

生成高質量的英語文本，適用於內容創作、翻譯等場景。

🚀 希伯來語-Gemma-11B-V2

希伯來語-Gemma-11B-V2 是希伯來語-Gemma-11B 的更新版本，經過了更長時間的訓練，並修復了一些漏洞。該模型是基於谷歌的 Gemma-7B 架構的開源大語言模型（LLM），是一個擁有 110 億參數的希伯來語/英語預訓練生成式文本模型。它在 gemma-7b 的基礎上繼續預訓練，擴展到了更大的規模，並在 30 億額外的英語和希伯來語文本數據上進行了訓練。最終得到的 Gemma-11B 是一個強大的通用語言模型，適用於廣泛的自然語言處理任務，尤其專注於希伯來語的理解和生成。

🚀 快速開始

首先，確保你已經安裝了 transformers 庫，你可以使用以下命令進行更新安裝：

pip install -U transformers

然後，根據你的使用場景，從下面的代碼片段中選擇適合你的部分進行復制使用。

💻 使用示例

基礎用法

在 CPU 上運行

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2")

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))

在 GPU 上運行

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2", device_map="auto")

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))

使用 4 位精度運行

from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B-V2", quantization_config = BitsAndBytesConfig(load_in_4bit=True))

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))