Qwen2.5 - 7B - embed - baseオープンソーステキスト埋め込みモデル - 無料で高品質なテキストベクトルを生成

ホーム

Qwen2.5 7B Embed Base

ssmitsによって開発

Qwen2.5-7B-embed-baseはTransformerアーキテクチャに基づく事前学習済み言語モデルで、高品質なテキスト埋め込みベクトル生成のために設計されています。

テキスト埋め込み

Safetensors

英語オープンソースライセンス:Apache-2.0 #多言語埋め込み #大規模モデルの微調整適応 #高次元意味符号化

ダウンロード数 85

リリース時間 : 11/24/2024

モデル概要

このモデルはQwen2.5シリーズの一部で、'lm_head'層を除去しており、テキスト埋め込みベクトル生成に適しており、テキスト類似度計算や情報検索などのタスクに使用できます。

モデル特徴

改良型トークナイザー

トークナイザーは複数の自然言語やコードに適応可能で、処理効率を向上させます

効率的な注意メカニズム

グループ化クエリ注意などの先進的なメカニズムを採用し、計算効率を最適化

埋め込みベクトル生成

高品質なテキスト埋め込みベクトル生成に最適化されており、下流タスクの微調整に適しています

モデル能力

テキスト埋め込み生成

テキスト類似度計算

意味検索

使用事例

情報検索

文書類似度マッチング

異なる文書間の意味的類似度を計算

意味的に類似した文書ペアを正確に識別可能

推薦システム

コンテンツ推薦

ユーザーの行動履歴とコンテンツ埋め込みベクトルに基づくパーソナライズド推薦

🚀 Qwen2.5-7B-embed-base

Qwen2.5-7B-embed-baseは、テキスト分類に特化した事前学習済みモデルです。このモデルは、Transformerアーキテクチャをベースに構築され、多言語やコードに適応したトークナイザーを備えています。

🚀 クイックスタート

このセクションでは、Qwen2.5-7B-embed-baseモデルの基本的な使い方を説明します。

✨ 主な機能

Qwen2.5は、異なるモデルサイズのデコーダ言語モデルを含む言語モデルシリーズです。
Transformerアーキテクチャをベースに、SwiGLU活性化関数、Attention QKVバイアス、Group Query Attentionなどを採用しています。
多言語やコードに適応した改良型トークナイザーを備えています。

📦 インストール

Qwen2.5のコードは最新のHugging Face Transformersに含まれています。以下のコマンドで必要なライブラリをインストールしてください。

pip install transformers>=4.37.0

これを行わないと、以下のエラーが発生する可能性があります。

KeyError: 'Qwen2.5'

💻 使用例

基本的な使用法

from sentence_transformers import SentenceTransformer
import torch

# 1. 事前学習済みのSentence Transformerモデルを読み込む
model = SentenceTransformer("ssmits/Qwen2.5-7B-embed-base") # VRAMが24GB以下の場合は device = "cpu" を指定

# エンコードする文章
sentences = [
    "The weather is lovely today.",
    "It's so sunny outside!",
    "He drove to the stadium.",
]

# 2. model.encode()を呼び出して埋め込みを計算する
embeddings = model.encode(sentences)
print(embeddings.shape)
# (3, 3584)

# 3. 埋め込みの類似度を計算する
# embeddingsがnumpy配列であると仮定し、torchテンソルに変換する
embeddings_tensor = torch.tensor(embeddings)

# torchを使用してコサイン類似度行列を計算する
similarities = torch.nn.functional.cosine_similarity(embeddings_tensor.unsqueeze(0), embeddings_tensor.unsqueeze(1), dim=2)

print(similarities)
# tensor([[1.0000, 0.8608, 0.6609],
#         [0.8608, 1.0000, 0.7046],
#         [0.6609, 0.7046, 1.0000]])

高度な使用法

from transformers import AutoTokenizer, AutoModel
import torch

#Mean Pooling - Take attention mask into account for correct averaging
def mean_pooling(model_output, attention_mask):
    token_embeddings = model_output[0] #First element of model_output contains all token embeddings
    input_mask_expanded = attention_mask.unsqueeze(-1).expand(token_embeddings.size()).float()
    return torch.sum(token_embeddings * input_mask_expanded, 1) / torch.clamp(input_mask_expanded.sum(1), min=1e-9)

# 文章埋め込みを取得したい文章
sentences = ['This is an example sentence', 'Each sentence is converted']

# HuggingFace Hubからモデルを読み込む
tokenizer = AutoTokenizer.from_pretrained('ssmits/Qwen2.5-7B-embed-base')
model = AutoModel.from_pretrained('ssmits/Qwen2.5-7B-embed-base') # VRAMが24GB以下の場合は device = "cpu" を指定

# 文章をトークナイズする
encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')

# トークン埋め込みを計算する
with torch.no_grad():
    model_output = model(**encoded_input)

# プーリングを実行する。この場合は平均プーリング。
sentence_embeddings = mean_pooling(model_output, encoded_input['attention_mask'])

print("Sentence embeddings:")
print(sentence_embeddings)

マルチGPUの有効化方法

from transformers import AutoModel
from torch.nn import DataParallel

model = AutoModel.from_pretrained("ssmits/Qwen2.5-7B-embed-base")
for module_key, module in model._modules.items():
    model._modules[module_key] = DataParallel(module)

🔧 技術詳細

Qwen2.5は、Transformerアーキテクチャをベースに構築された言語モデルシリーズです。このモデルは、SwiGLU活性化関数、Attention QKVバイアス、Group Query Attentionなどの技術を採用しており、多言語やコードに適応した改良型トークナイザーを備えています。