hypencoder.8_layer開源信息檢索模型 - 免費將文本轉網絡算相關分數

首頁

Hypencoder.8 Layer

由jfkback開發

Hypencoder是一種用於信息檢索的雙編碼器模型，包含文本編碼器和超網絡（Hypencoder），能夠將文本轉換為小型神經網絡用於計算相關性分數。

文本嵌入

Transformers

英語開源協議:MIT #雙編碼器架構 #超網絡檢索 #動態相關性評分

下載量 18

發布時間 : 2/12/2025

模型概述

該模型通過雙編碼器架構實現信息檢索功能，其中文本編碼器將項目轉換為768維向量，Hypencoder則將文本轉換為小型神經網絡，用於輸出相關性分數。

模型特點

超網絡架構

使用Hypencoder將文本轉換為小型神經網絡，動態生成相關性評分函數

可配置隱藏層

提供2/4/6/8層隱藏層的不同變體，可根據需求選擇模型複雜度

雙編碼器設計

結合傳統文本編碼器和創新的Hypencoder，實現高效的信息檢索

模型能力

文本特徵提取

相關性評分

信息檢索

使用案例

搜索引擎

查詢-文檔相關性評估

計算用戶查詢與候選文檔之間的相關性分數

可有效排序檢索結果

問答系統

答案候選排序

對問答系統中的候選答案進行相關性排序

提高答案准確率

🚀 Hypencoder模型

Hypencoder是一種用於信息檢索的模型，基於超網絡架構，能將文本轉換為相關得分，在信息檢索任務中表現出色。

🚀 快速開始

本模型是論文 Hypencoder: Hypernetworks for Information Retrieval 中的官方模型。若要使用該模型，請查看 Github 頁面，其中包含所需代碼和運行模型的詳細說明。

✨ 主要特性

這是一個Hypencoder雙編碼器，包含文本編碼器和Hypencoder兩個主幹部分。
文本編碼器將文本項轉換為768維向量，Hypencoder則將文本轉換為一個小型神經網絡，該網絡以文本編碼器輸出的768維向量為輸入，最終輸出相關性得分。

📦 安裝指南

文檔未提供具體安裝步驟，故跳過該章節。

💻 使用示例

基礎用法

from hypencoder_cb.modeling.hypencoder import Hypencoder, HypencoderDualEncoder, TextEncoder
from transformers import AutoTokenizer

dual_encoder = HypencoderDualEncoder.from_pretrained("jfkback/hypencoder.6_layer")
tokenizer = AutoTokenizer.from_pretrained("jfkback/hypencoder.6_layer")

query_encoder: Hypencoder = dual_encoder.query_encoder
passage_encoder: TextEncoder = dual_encoder.passage_encoder

queries = [
    "how many states are there in india",
    "when do concussion symptoms appear",
]

passages = [
    "India has 28 states and 8 union territories.",
    "Concussion symptoms can appear immediately or up to 72 hours after the injury.",
]

query_inputs = tokenizer(queries, return_tensors="pt", padding=True, truncation=True)
passage_inputs = tokenizer(passages, return_tensors="pt", padding=True, truncation=True)

q_nets = query_encoder(input_ids=query_inputs["input_ids"], attention_mask=query_inputs["attention_mask"]).representation
passage_embeddings = passage_encoder(input_ids=passage_inputs["input_ids"], attention_mask=passage_inputs["attention_mask"]).representation

# The passage_embeddings has shape (2, 768), but the q_nets expect the shape
# (num_queries, num_items_per_query, input_hidden_size) so we need to reshape
# the passage_embeddings.

# In the simple case where each q_net only takes one passage, we can just
# reshape the passage_embeddings to (num_queries, 1, input_hidden_size).
passage_embeddings_single = passage_embeddings.unsqueeze(1)
scores = q_nets(passage_embeddings_single)  # Shape (2, 1, 1)
# [
#    [[-12.1192]],
#    [[-13.5832]]
# ]

# In the case where each q_net takes both passages we can reshape the
# passage_embeddings to (num_queries, 2, input_hidden_size).
passage_embeddings_double = passage_embeddings.repeat(2, 1).reshape(2, 2, -1)
scores = q_nets(passage_embeddings_double)  # Shape (2, 2, 1)
# [
#    [[-12.1192], [-32.7046]],
#    [[-34.0934], [-13.5832]]
# ]

📚 詳細文檔

模型變體

我們發佈了論文中使用的四個模型。除了被稱為q - nets的小型神經網絡的隱藏層數量不同外，每個模型的其他部分相同。

Huggingface倉庫	層數
jfkback/hypencoder.2_layer	2
jfkback/hypencoder.4_layer	4
jfkback/hypencoder.6_layer	6
jfkback/hypencoder.8_layer	8

模型信息

屬性	詳情
基礎模型	google-bert/bert-base-uncased
數據集	microsoft/ms_marco
語言	en
庫名稱	transformers
任務類型	特徵提取

🔧 技術細節

文檔未提供具體技術細節內容，故跳過該章節。

📄 許可證

本項目採用MIT許可證。

📚 引用

如果您在研究中使用了該模型，請使用以下BibTeX引用：

@misc{killingback2025hypencoderhypernetworksinformationretrieval,
      title={Hypencoder: Hypernetworks for Information Retrieval}, 
      author={Julian Killingback and Hansi Zeng and Hamed Zamani},
      year={2025},
      eprint={2502.05364},
      archivePrefix={arXiv},
      primaryClass={cs.IR},
      url={https://arxiv.org/abs/2502.05364}, 
}