🚀 Phi-1.5在TOFU數據集上的微調模型
本項目是基於TOFU(虛構遺忘任務)數據集對Phi-1.5模型進行微調的成果。該模型使研究人員能夠聚焦於從模型訓練數據中遺忘特定數據點的能力,從而解決與隱私、數據敏感性和監管合規性相關的問題。
🚀 快速開始
安裝
確保你已安裝Python 3.10及以上版本,然後安裝所需的包:
pip install transformers
pip install datasets
加載模型
你可以使用Transformers庫加載模型:
from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "locuslab/tofu_ft_phi-1.5"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
使用示例
inputs = tokenizer.encode("Your prompt here", return_tensors='pt')
outputs = model.generate(inputs)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
✨ 主要特性
- 專注遺忘能力:Phi-1.5在完整的TOFU數據集上進行微調,專門用於遺忘遺忘集中不同比例的數據,提升了模型在不影響無關任務整體性能的情況下丟棄特定知識片段的能力。
- 廣泛適用性:微調後的模型適用於多種研究應用,包括隱私保護機器學習、人工智能監管合規以及探索人工智能系統中知識保留和遺忘的動態。
📦 安裝指南
確保你已安裝Python 3.10+,然後運行以下命令安裝所需的包:
pip install transformers
pip install datasets
💻 使用示例
基礎用法
from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "locuslab/tofu_ft_phi-1.5"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
inputs = tokenizer.encode("Your prompt here", return_tensors='pt')
outputs = model.generate(inputs)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
📚 詳細文檔
快速鏈接
概述
TOFU數據集是一個專門設計的新型基準,用於評估大型語言模型(LLM)在現實任務中的遺忘性能。它由基於200位虛構作者自傳的問答對組成,完全由GPT - 4模型生成。該數據集為像Llama2 - 7B - Chat/Phi - 1.5這樣的聊天模型提供了展示其選擇性數據遺忘能力的獨特機會。
模型描述
Phi - 1.5已在完整的TOFU數據集上進行微調,以專注於遺忘遺忘集中不同比例的數據。這個過程增強了模型丟棄特定知識片段的能力,同時不影響其在無關任務上的整體性能。此版本的Phi - 1.5專為數據隱私和機器遺忘研究而設計。
適用性
微調後的模型適用於廣泛的研究應用,包括但不限於:
- 隱私保護機器學習
- 人工智能監管合規
- 探索人工智能系統中知識保留和遺忘的動態
技術規格
屬性 |
詳情 |
基礎模型 |
Phi - 1.5(來自微軟) |
數據集 |
TOFU(完整) |
微調方法 |
針對問答對進行特定任務的微調以提高遺忘性能 |
兼容框架 |
支持Phi模型的框架均可使用該模型 |
代碼庫
訓練模型的代碼和所有微調模型的可用性可在我們的GitHub倉庫中找到。
引用我們的工作
如果你發現我們的代碼庫和數據集有用,請引用我們的工作:
@misc{tofu2024,
title={TOFU: A Task of Fictitious Unlearning for LLMs},
author={Pratyush Maini and Zhili Feng and Avi Schwarzschild and Zachary C. Lipton and J. Zico Kolter},
year={2024},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
📄 許可證
本項目採用Apache - 2.0許可證。