MiniLM-L6-dmr/WebLINX開源模型 - 多輪對話導航網站提升交互體驗

首頁

Minilm L6 Dmr

由McGill-NLP開發

WebLINX是一個專注於通過多輪對話實現真實世界網站導航的模型，旨在提升用戶在複雜網站中的交互體驗。

對話系統

Transformers

#多輪對話導航 #真實網站交互 #網頁動作預測

下載量 90

發布時間 : 2/8/2024

模型概述

該模型專注於理解和執行基於多輪對話的網站導航任務，能夠處理真實世界網站中的複雜交互場景。

模型特點

多輪對話支持

能夠處理複雜的多輪對話場景，實現更自然的網站導航交互。

真實世界網站適配

針對真實世界網站的複雜結構和交互進行優化，提升導航準確性。

對話上下文理解

能夠理解和記憶對話上下文，提供連貫的導航體驗。

模型能力

理解自然語言指令

執行網站導航操作

處理多輪對話

適應複雜網站結構

使用案例

網站導航輔助

電子商務網站導航

幫助用戶通過對話在複雜的電子商務網站中找到所需商品

提升用戶購物體驗和效率

政府網站服務引導

引導用戶完成政府網站上的複雜服務流程

降低用戶使用門檻

無障礙訪問

視障用戶網站導航

通過語音對話幫助視障用戶瀏覽網站內容

提高網站可訪問性

🚀 WebLINX: 基於多輪對話的真實世界網站導航

WebLINX是一個用於真實世界網站導航的模型，藉助多輪對話的方式，能夠更高效地實現網站導航功能。

🚀 快速開始

本項目提供了論文、網站、探索器、數據集和代碼的訪問鏈接，方便用戶快速瞭解和使用：

✨ 主要特性

本模型基於Sentence Transformers，可將句子和段落映射到384維的密集向量空間，適用於聚類或語義搜索等任務。
在WebLINX數據集上進行微調，使用了之前在Huggingface Hub上發佈的檢查點。

📦 安裝指南

若要使用此模型，需安裝sentence-transformers：

pip install -U sentence-transformers

💻 使用示例

基礎用法

當安裝了sentence-transformers後，可按如下方式使用模型：

from sentence_transformers import SentenceTransformer
sentences = ["This is an example sentence", "Each sentence is converted"]

model = SentenceTransformer('McGill-NLP/MiniLM-L6-dmr')
embeddings = model.encode(sentences)
print(embeddings)

高級用法

若未安裝sentence-transformers，可按以下步驟使用模型：首先將輸入傳遞給Transformer模型，然後對上下文詞嵌入應用正確的池化操作。

from transformers import AutoTokenizer, AutoModel
import torch


#Mean Pooling - Take attention mask into account for correct averaging
def mean_pooling(model_output, attention_mask):
    token_embeddings = model_output[0] #First element of model_output contains all token embeddings
    input_mask_expanded = attention_mask.unsqueeze(-1).expand(token_embeddings.size()).float()
    return torch.sum(token_embeddings * input_mask_expanded, 1) / torch.clamp(input_mask_expanded.sum(1), min=1e-9)


# Sentences we want sentence embeddings for
sentences = ['This is an example sentence', 'Each sentence is converted']

# Load model from HuggingFace Hub
tokenizer = AutoTokenizer.from_pretrained('McGill-NLP/MiniLM-L6-dmr')
model = AutoModel.from_pretrained('McGill-NLP/MiniLM-L6-dmr')

# Tokenize sentences
encoded_input = tokenizer(sentences, padding=True, truncation=True, return_tensors='pt')

# Compute token embeddings
with torch.no_grad():
    model_output = model(**encoded_input)

# Perform pooling. In this case, mean pooling.
sentence_embeddings = mean_pooling(model_output, encoded_input['attention_mask'])

print("Sentence embeddings:")
print(sentence_embeddings)

📚 詳細文檔

評估結果

要對該模型進行自動評估，可參考 Sentence Embeddings Benchmark：https://seb.sbert.net

訓練參數

模型的訓練參數如下：

數據加載器： torch.utils.data.dataloader.DataLoader，長度為2560，參數如下：

{'batch_size': 64, 'sampler': 'torch.utils.data.sampler.RandomSampler', 'batch_sampler': 'torch.utils.data.sampler.BatchSampler'}

損失函數： sentence_transformers.losses.CosineSimilarityLoss.CosineSimilarityLoss

fit()方法的參數：

{
    "epochs": 10,
    "evaluation_steps": 0,
    "evaluator": "NoneType",
    "max_grad_norm": 1,
    "optimizer_class": "<class 'torch.optim.adamw.AdamW'>",
    "optimizer_params": {
        "lr": 3e-05
    },
    "scheduler": "warmuplinear",
    "steps_per_epoch": null,
    "warmup_steps": 500,
    "weight_decay": 0.0
}

完整模型架構

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False})
)