EEVE-Korean-Instruct-10.8B-v1.0開源大模型 - 專注韓語理解與生成任務

首頁

EEVE Korean Instruct 10.8B V1.0 Gguf

由teddylee777開發

EEVE-Korean-Instruct-10.8B-v1.0 是一個韓語指令微調的大型語言模型，基於 yanolja/EEVE-Korean-10.8B-v1.0 基礎模型開發，專注於韓語理解和生成任務。

大型語言模型開源協議:Apache-2.0 #韓語指令優化 #多輪對話生成 #高質量反饋訓練

下載量 626

發布時間 : 4/25/2024

模型概述

該模型是一個10.8B參數規模的韓語指令微調模型，主要用於韓語對話和指令理解任務。它基於 llama.cpp 進行了量化優化，適合在本地環境中部署使用。

模型特點

韓語優化

專門針對韓語理解和生成任務進行了優化，在韓語處理方面表現優異

指令微調

經過指令微調，能夠更好地理解和執行用戶指令

量化支持

支持通過 llama.cpp 進行量化，便於在資源有限的環境中部署

模型能力

韓語文本生成

指令理解與執行

對話系統

知識問答

使用案例

對話系統

智能客服

可用於構建韓語智能客服系統，處理用戶諮詢

個人助手

作為個人數字助手，回答用戶問題和執行簡單任務

教育

語言學習

輔助韓語學習者進行語言練習和答疑

🚀 yanolja/EEVE-Korean-Instruct-10.8B-v1.0

該項目基於yanolja/EEVE-Korean-10.8B-v1.0模型，使用llama.cpp進行量化處理，適用於韓語對話場景，為用戶提供智能問答服務。

🚀 快速開始

原模型為 yanolja/EEVE-Korean-Instruct-10.8B-v1.0，並使用 llama.cpp 進行量化。

Ollama 的 Modelfile 配置

FROM EEVE-Korean-Instruct-10.8B-v1.0-Q8_0.gguf

TEMPLATE """{{- if .System }}
<s>{{ .System }}</s>
{{- end }}
<s>Human:
{{ .Prompt }}</s>
<s>Assistant:
"""

SYSTEM """A chat between a curious user and an artificial intelligence assistant. The assistant gives helpful, detailed, and polite answers to the user's questions."""

PARAMETER temperature 0
PARAMETER num_predict 3000
PARAMETER num_ctx 4096
PARAMETER stop <s>
PARAMETER stop </s>

📦 訓練數據

屬性	詳情
訓練數據	Open-Orca/SlimOrca-Dedup 的韓語翻譯版本；argilla/ultrafeedback-binarized-preferences-cleaned 的韓語翻譯版本；未使用其他數據集

📄 許可證

本項目採用 Apache-2.0 許可證。

📚 引用

@misc{kim2024efficient,
      title={Efficient and Effective Vocabulary Expansion Towards Multilingual Large Language Models}, 
      author={Seungduk Kim and Seungtaek Choi and Myeongho Jeong},
      year={2024},
      eprint={2402.14714},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

@misc{cui2023ultrafeedback,
      title={UltraFeedback: Boosting Language Models with High-quality Feedback}, 
      author={Ganqu Cui and Lifan Yuan and Ning Ding and Guanming Yao and Wei Zhu and Yuan Ni and Guotong Xie and Zhiyuan Liu and Maosong Sun},
      year={2023},
      eprint={2310.01377},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}

@misc{SlimOrcaDedup,
  title = {SlimOrca Dedup: A Deduplicated Subset of SlimOrca},
  author = {Wing Lian and Guan Wang and Bleys Goodson and Eugene Pentland and Austin Cook and Chanvichet Vong and "Teknium" and Nathan Hoos},
  year = {2023},
  publisher = {HuggingFace},
  url = {https://huggingface.co/datasets/Open-Orca/SlimOrca-Dedup/}
}

@misc{mukherjee2023orca,
      title={Orca: Progressive Learning from Complex Explanation Traces of GPT-4}, 
      author={Subhabrata Mukherjee and Arindam Mitra and Ganesh Jawahar and Sahaj Agarwal and Hamid Palangi and Ahmed Awadallah},
      year={2023},
      eprint={2306.02707},
      archivePrefix={arXiv},
      primaryClass={cs.CL}
}