ブーマー-634Mオープンソース大規模言語モデル - 合成データセットを基に訓練され、様々な質問に無料で回答

ホーム

Boomer 634m

budecosystemによって開発

boomer-634mは6.34億のパラメータを持つ大規模言語モデルで、120億トークンのカスタム合成データセットを使用してゼロから事前学習されています。

大規模言語モデル

Transformers

英語オープンソースライセンス:Apache-2.0 #6.34億パラメータ #合成データ事前学習 #マルチタスクベンチマークテスト

ダウンロード数 74

リリース時間 : 4/9/2024

モデル概要

このモデルは、オープンソースコミュニティにおける大規模言語モデルの利用を普及させ、人工知能の発展を促進することを目的としています。

モデル特徴

大規模事前学習

120億トークンのカスタム合成データセットを使用した事前学習

オープンソース普及

オープンソースコミュニティに使いやすい大規模言語モデルを提供することを目指しています

マルチベンチマークテスト

MMLU、ARC、Hellaswagなどの複数のベンチマークテストで評価されています

モデル能力

テキスト生成

質問応答システム

知識推論

使用事例

教育

科学知識質問応答

自然科学に関する質問に回答します。例えば、空が青い理由を説明します

研究

論理推論テスト

論理的推論能力の評価に使用されます

logiqaベンチマークテストで28.42点を獲得

🚀 ブーマー - 634mモデル

オープンソースコミュニティに対して大規模言語モデルへのアクセスを民主化します。一緒にAIを進化させましょう。

オープンソースコミュニティに対して大規模言語モデルへのアクセスを民主化します。
一緒にAIを進化させましょう。

🚀 クイックスタート

私たちは、AI研究における重要なマイルストーンとなるboomer - 634mモデルのオープンソース化を嬉しく思います。このモデルは6億3400万のパラメータを持ち、120億トークンからなるカスタム合成データセットでゼロから慎重に事前学習されました。

💻 使用例

基本的な使用法

boomer - 634mを始めるためのクイックガイドです。現在のところ、モデルを実行するにはtrust_remote_code=Trueが必要です。

from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("budecosystem/boomer-634m",
                                             trust_remote_code=True)
tokenizer = AutoTokenizer.from_pretrained("budecosystem/boomer-634m")

input_ids = tokenizer("Explain why the sky is blue.", return_tensors='pt').to(model.device)["input_ids"]
outputs = model.generate(input_ids, max_new_tokens=216)
print(tokenizer.batch_decode(outputs))