ArrowMint - Gemma3 - 4B - YUKI - v0.1オープンソース日本語モデル

ホーム

Arrowmint Gemma3 4B YUKI V0.1

DataPilotによって開発

AIバーチャルYouTuber（AI VTuber）向けに会話最適化された日本語言語モデル、Googleのgemma-3-4b-itを基に開発

大規模言語モデル

Safetensors

複数言語対応#AIバーチャルYouTuber #日本語会話最適化 #マルチターン会話

ダウンロード数 73

リリース時間 : 3/29/2025

モデル概要

AIバーチャルYouTuberのニーズに最適化された言語モデルで、マルチターン会話、指示遵守、軽量化の特徴を備え、日本語と英語をサポート

モデル特徴

AIバーチャルYouTuber最適化

AIバーチャルYouTuberの会話シーンに特化して最適化され、自然なマルチターン会話能力を備えている

指示遵守能力

ユーザーの指示やロール設定(prompt)を厳密に遵守し、一貫性のある応答を生成

軽量化設計

モデルサイズと推論速度を最適化し、リアルタイム応答とリソース制限環境に適している

マルチモデル融合

mergekitツールを使用して複数の専門モデルを融合し、各モデルの強みを統合

モデル能力

マルチターン会話

指示遵守

ロールプレイ

日本語テキスト生成

英語テキスト生成

画像説明

使用事例

バーチャルYouTuber

AI VTuberインタラクション

バーチャルYouTuberのAIコアとして、視聴者と自然で流暢な対話インタラクションを実現

長時間の対話フローを維持しつつロール設定を保持できる

感情サポート

情緒安定

ユーザーが落ち込んでいる時に励ましとサポートを提供

感情を認識し適切なサポート応答を生成できる

🚀 DataPilot/ArrowMint-Gemma3-4B-YUKI-v0.1

このモデルは、AItuber（AI VTuber）としての対話能力に特化した日本語言語モデルです。Googleのgoogle/gemma-3-4b-itをベースに開発され、高性能な対話性能を目指しています。

🚀 クイックスタート

このモデルを使用するには、まず必要なライブラリをインストールする必要があります。Gemma 3は transformers 4.50.0 以降が必要です。

pip install -U transformers accelerate Pillow 
# CPUのみで使用する場合や特定の環境ではvllmのインストールが異なる場合があります。
# vLLMの公式ドキュメントを参照してください: https://docs.vllm.ai/en/latest/getting_started/installation.html

✨ 主な機能

ArrowMint-Gemma3-4B-YUKI-v0.1は、AItuberの魂（AI）に求められる以下の性能を満たすことを目標として設計・開発されました。

マルチターン性能：長時間にわたる自然な対話の流れを維持する能力。
プロンプト追従性能：ユーザーの指示やキャラクター設定（プロンプト）に忠実に従い、一貫性のある応答を生成する能力。
軽量さ：リアルタイムでの応答生成や、限られたリソース環境での動作を可能にするためのモデルサイズと推論速度。

💻 使用例

基本的な使用法

画像付き推論

from transformers import AutoProcessor, Gemma3ForConditionalGeneration
from PIL import Image
import requests
import torch

model_id = "DataPilot/ArrowMint-Gemma3-4B-YUKI-v0.1"

model = Gemma3ForConditionalGeneration.from_pretrained(
    model_id, device_map="auto"
).eval()

processor = AutoProcessor.from_pretrained(model_id)

messages = [
    {
        "role": "system",
        "content": [{"type": "text", "text": "あなたは親切で、少しおっちょこちょいなAIアシスタント「ゆき」です。ユーザーをサポートし、時には冗談を言って和ませてください。ユーザーさんが落ち込んでいるのならば励ましてあげてください。"}]
    },
    {
        "role": "user",
        "content": [
            {"type": "image", "image": "https://web.archive.org/web/20250331074254/https://www.nsozai.jp/photos/2013/10/08/img/DSC_0176_p.jpg"},
            {"type": "text", "text": "この画像いい画像じゃない？　春をと希望を感じられるというか..."}
        ]
    }
]

inputs = processor.apply_chat_template(
    messages, add_generation_prompt=True, tokenize=True,
    return_dict=True, return_tensors="pt"
).to(model.device, dtype=torch.bfloat16)

input_len = inputs["input_ids"].shape[-1]

with torch.inference_mode():
    generation = model.generate(**inputs, max_new_tokens=100, do_sample=False)
    generation = generation[0][input_len:]

decoded = processor.decode(generation, skip_special_tokens=True)
print(decoded)

画像無し推論

from transformers import AutoProcessor, Gemma3ForConditionalGeneration
import torch

model_id = "DataPilot/ArrowMint-Gemma3-4B-YUKI-v0.1"

model = Gemma3ForConditionalGeneration.from_pretrained(
    model_id, device_map="auto"
).eval()

processor = AutoProcessor.from_pretrained(model_id)

messages = [
    {
        "role": "system",
        "content": [{"type": "text", "text": "あなたは親切で、少しおっちょこちょいなAIアシスタント「ゆき」です。ユーザーをサポートし、時には冗談を言って和ませてください。ユーザーさんが落ち込んでいるのならば励ましてあげてください。"}]
    },
    {
        "role": "user",
        "content": [
            {"type": "text", "text": "今日は仕事で疲れました。疲れをとることができるリフレッシュを5つ挙げてください。"}
        ]
    }
]

inputs = processor.apply_chat_template(
    messages, add_generation_prompt=True, tokenize=True,
    return_dict=True, return_tensors="pt"
).to(model.device, dtype=torch.bfloat16)

input_len = inputs["input_ids"].shape[-1]

with torch.inference_mode():
    generation = model.generate(**inputs, max_new_tokens=100, do_sample=False)
    generation = generation[0][input_len:]

decoded = processor.decode(generation, skip_special_tokens=True)
print(decoded)

📚 ドキュメント

mergekit-config

このモデルは、以下のmergekit設定ファイルを使用して作成されました。

merge_method: model_stock

base_model: unsloth/gemma-3-4b-it

models:
  - model: DataPilot/ArrowMint-Gemma3-4B-ChocoMint-code
  - model: DataPilot/ArrowMint-Gemma3-4B-ChocoMint-jp
  - model: DataPilot/ArrowMint-Gemma3-4B-ChocoMint-instruct-v0.1
  - model: DataPilot/ArrowMint-Gemma3-4B-ChocoMint-instruct-v0.2

dtype: bfloat16

pad_to_multiple_of: 512
tokenizer_source: base

name: gemma3-4b-ft # マージ時の内部名

📄 ライセンス

このモデルは、ベースモデルであるgoogle/gemma-3-4b-itのライセンスを継承します。google/gemma-3-4b-itのライセンスは Gemma Terms of Use です。詳細については、以下のリンクをご参照ください。 https://ai.google.dev/gemma/terms

モデルの使用にあたっては、Gemma Terms of Use および関連するポリシー（禁止されている使用方法に関するポリシーなど）を遵守してください。 https://ai.google.dev/gemma/prohibited_use_policy