EEVE-Korean-Instruct-10.8B-v1.0-Grade-Retrieval開源模型

首頁

EEVE Korean Instruct 10.8B V1.0 Grade Retrieval

由sinjy1203開發

該模型是基於EEVE-韓語指導-10.8B-v1.0微調的，用於評估RAG（檢索增強生成）中針對問題的檢索上下文是否正確，並以'是'或'否'回答。

大型語言模型

Transformers

韓語開源協議:Apache-2.0 #韓語RAG評估 #檢索質量評分 #高精度分類

下載量 1,764

發布時間 : 6/4/2024

模型概述

該模型專門用於評估在檢索增強生成（RAG）系統中檢索到的上下文信息是否足夠回答問題，輸出為簡單的'是'或'否'判斷。

模型特點

檢索上下文評估

能夠準確評估檢索到的上下文信息是否足以回答給定的問題

簡潔輸出

輸出僅為'是'或'否'，便於系統集成和處理

韓語優化

專門針對韓語內容和問題進行了優化

模型能力

文本分類

檢索質量評估

韓語理解

使用案例

檢索增強生成系統

RAG系統檢索質量監控

在RAG系統中自動評估檢索到的上下文是否相關和充分

提高系統整體回答質量

知識庫檢索優化

評估知識庫檢索結果的質量，幫助優化檢索算法

提升知識庫檢索準確率

🚀 EEVE-Korean-Instruct-10.8B-v1.0-Grade-Retrieval

本模型經過微調，用於評估檢索增強生成（RAG）中針對某個問題所檢索到的上下文是否正確，並以“是”或“否”進行回答。

📚 詳細文檔

關於模型

該模型的基礎模型是 yanolja/EEVE-Korean-Instruct-10.8B-v1.0。

提示模板

當給定問題和信息時，請評估這些信息是否足以回答該問題。
請用“예（是）”或“아니오（否）”來回答信息是否充足。

### 問題: 
{question}

### 信息: 
{context}

### 評估:

🚀 快速開始

如何使用

import torch
from transformers import (
    BitsAndBytesConfig,
    AutoModelForCausalLM,
    AutoTokenizer,
)

model_path = "sinjy1203/EEVE-Korean-Instruct-10.8B-v1.0-Grade-Retrieval"
nf4_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_use_double_quant=True,
    bnb_4bit_compute_dtype=torch.float16,
)

tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(
    model_path, quantization_config=nf4_config, device_map={'': 'cuda:0'}
)

prompt_template = '주어진 질문과 정보가 주어졌을 때 질문에 답하기에 충분한 정보인지 평가해줘.\n정보가 충분한지를 평가하기 위해 "예" 또는 "아니오"로 답해줘.\n\n### 질문:\n{question}\n\n### 정보:\n{context}\n\n### 평가:\n'
query = {
    "question": "동아리 종강총회가 언제인가요?",
    "context": "종강총회 날짜는 6월 21일입니다."
}

model_inputs = tokenizer(prompt_template.format_map(query), return_tensors='pt')
output = model.generate(**model_inputs, max_new_tokens=100, max_length=200)
print(output)

示例輸出

當給定問題和信息時，請評估這些信息是否足以回答該問題。
請用“예（是）”或“아니오（否）”來回答信息是否充足。

### 問題:
社團結課總會什麼時候舉行？

### 信息:
結課總會日期是6月21日。

### 評估:
예<|end_of_text|>

訓練數據

參考了 stanford_alpaca 生成的指令。
使用 yanolja/EEVE-Korean-Instruct-10.8B-v1.0 作為問題生成的模型。

🔧 技術細節

指標

韓語大語言模型基準測試

模型	平均分	Ko-ARC	Ko-HellaSwag	Ko-MMLU	Ko-TruthfulQA	Ko-CommonGen V2
EEVE-Korean-Instruct-10.8B-v1.0	56.08	55.2	66.11	56.48	49.14	53.48
EEVE-Korean-Instruct-10.8B-v1.0-Grade-Retrieval	56.1	55.55	65.95	56.24	48.66	54.07

生成數據集

模型	準確率	F1值	精確率	召回率
EEVE-Korean-Instruct-10.8B-v1.0	0.824	0.800	0.885	0.697
EEVE-Korean-Instruct-10.8B-v1.0-Grade-Retrieval	0.892	0.875	0.903	0.848

📄 許可證

本項目採用 Apache-2.0 許可證。

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫