Hebrew-Gemma-11B開源大語言模型 - 免費實現希伯來語/英語文本生成

首頁

Hebrew Gemma 11B

由yam-peleg開發

基於谷歌Gemma-7B架構的開源大語言模型，專為希伯來語/英語生成文本預訓練，擁有110億參數。

大型語言模型

Transformers

支持多種語言開源協議:其他 #希伯來語生成 #110億參數大模型 #雙語混合訓練

下載量 69

發布時間 : 3/6/2024

模型概述

希伯來語-Gemma-11B是一個開源的大語言模型，基於谷歌的Gemma-7B架構，專為希伯來語和英語生成文本預訓練。該模型在gemma-7b的基礎上繼續預訓練，擴展至更大規模，並額外訓練了30億個英語和希伯來語文本數據標記。

模型特點

多語言支持

專為希伯來語和英語生成文本優化，支持雙語理解和生成。

大規模預訓練

在gemma-7b基礎上繼續預訓練，額外訓練了30億個英語和希伯來語文本數據標記。

開源模型

作為開源模型，用戶可以自由使用和修改，受谷歌原始許可證和使用條款約束。

模型能力

希伯來語文本生成

英語文本生成

自然語言理解

使用案例

自然語言處理

希伯來語內容創作

生成希伯來語文章、故事或其他文本內容。

雙語對話系統

構建支持希伯來語和英語的對話系統。

🚀 希伯來語Gemma-11B模型

希伯來語Gemma-11B是一個開源的大語言模型（LLM），是一個擁有110億參數的希伯來語/英語預訓練生成式文本模型，基於谷歌的Gemma-7B架構。它在Gemma-7B的基礎上繼續預訓練，擴展到更大規模，並在30億額外的英語和希伯來語文本數據上進行訓練。由此得到的Gemma-11B模型是一個強大的通用語言模型，適用於廣泛的自然語言處理任務，尤其專注於希伯來語的理解和生成。

🚀 快速開始

首先確保執行 pip install -U transformers，然後根據你的使用場景複製相應的代碼片段。

✨ 主要特性

基於谷歌的Gemma-7B架構，擁有110億參數。
在英語和希伯來語的30億額外文本數據上進行繼續預訓練。
適用於廣泛的自然語言處理任務，專注於希伯來語理解和生成。

📦 安裝指南

使用前請確保安裝最新的 transformers 庫：

pip install -U transformers

💻 使用示例

基礎用法

在CPU上運行

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B")

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))

在GPU上運行

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B", device_map="auto")

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))

高級用法

使用4位精度運行

from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig

tokenizer = AutoTokenizer.from_pretrained("yam-peleg/Hebrew-Gemma-11B")
model = AutoModelForCausalLM.from_pretrained("yam-peleg/Hebrew-Gemma-11B", quantization_config = BitsAndBytesConfig(load_in_4bit=True))

input_text = "שלום! מה שלומך היום?"
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")

outputs = model.generate(**input_ids)
print(tokenizer.decode(outputs[0]))