🚀 T5-Base 職位描述轉簡歷 JSON
本模型對 google/t5-base 進行微調,可將職位描述轉換為結構化的簡歷 JSON 數據。
🚀 快速開始
使用以下代碼開始使用該模型。
點擊展開
from transformers import T5Tokenizer, T5ForConditionalGeneration
def load_model_and_tokenizer(model_path):
"""
Load the tokenizer and model from the specified path.
"""
tokenizer = T5Tokenizer.from_pretrained("google-t5/t5-base")
model = T5ForConditionalGeneration.from_pretrained(model_path)
return tokenizer, model
def generate_text(prompt, tokenizer, model):
"""
Generate text using the model based on the given prompt.
"""
input_ids = tokenizer(prompt, return_tensors="pt", padding=True).input_ids
outputs = model.generate(input_ids, max_length=512, num_return_sequences=1)
generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
return generated_text
def main():
model_path = "nakamoto-yama/t5-resume-generation"
print(f"Loading model and tokenizer from {model_path}")
tokenizer, model = load_model_and_tokenizer(model_path)
while True:
prompt = input("Enter a job description or title: ")
if prompt.lower() == 'exit':
break
response = generate_text(f"generate resume JSON for the following job: {prompt}", tokenizer, model)
response = response.replace("LB>", "{").replace("RB>", "}")
print(f"Generated Response: {response}")
if __name__ == "__main__":
main()
更多示例請參閱 Hugging Face T5 文檔以及模型開發者創建的 Colab 筆記本。
✨ 主要特性
- 基於 T5-base 架構,在 10,000 個職位描述與簡歷對的數據集上進行微調。
- 可將職位描述作為輸入,生成針對該職位的簡歷 JSON 表示。
📚 詳細文檔
模型描述
本模型基於 T5-base 架構,在包含 10,000 個職位描述與簡歷對的數據集上進行了微調。它以職位描述為輸入,生成針對該職位的簡歷的 JSON 表示。
屬性 |
詳情 |
模型類型 |
基於 T5-base 架構微調的文本到 JSON 轉換模型 |
訓練數據 |
10,000 個職位描述與簡歷對 |
預期用途與侷限性
預期用途:
- 從職位描述生成結構化的簡歷數據。
- 協助求職者根據特定職位發佈定製簡歷。
- 自動化部分簡歷創建過程。
侷限性:
- 模型的輸出質量取決於輸入職位描述的詳細程度和清晰度。
- 生成的簡歷可能需要人工審核和編輯。
- 模型可能無法捕捉細微或特定行業的要求。
- 模型未進行分詞以輸出 “{” 或 “}”,而是分別使用 “RB>” 和 “LB>”。
訓練數據
該模型在 10,000 對職位描述和相應的簡歷 JSON 數據上進行了訓練。訓練集中的數據分佈和任何潛在偏差未作具體說明。
訓練過程
該模型使用標準的 T5 文本到文本框架進行微調。具體的超參數和訓練細節未提供。
倫理考量
此模型自動化了部分簡歷創建過程,這可能對求職和招聘實踐產生影響。用戶應意識到訓練數據中可能存在的偏差,這些偏差可能會影響生成的簡歷。
額外信息
有關基礎 T5 模型的更多詳細信息,請參閱 T5 論文 和 google/t5-base 模型卡片。
📄 許可證
本項目採用 MIT 許可證。