🚀 卡納納1.5-2.1B基礎模型
卡納納1.5-2.1B基礎模型是一款強大的文本生成模型,在編碼、數學和函數調用能力上有顯著提升,能處理長文本,對話更自然準確,為複雜的實際問題提供了有效的解決方案。
✨ 1.5 HF模型   |
  📝 1.5博客   |
  📖 技術報告
📢 新聞動態
2025/05/23
:發佈了關於卡納納1.5
模型的博客文章,併發布了✨HF模型權重。
- 📖
2025/02/27
:發佈了技術報告和✨HF模型權重。
- 📝
2025/01/10
:發佈了關於卡納納納米
模型開發的博客文章。
- 📝
2024/11/14
:發佈了關於卡納納
模型開發的博客文章(預訓練,後訓練)。
- 📺
2024/11/06
:發佈了關於卡納納
模型開發的演示視頻。
📚 目錄
🤖 卡納納1.5
卡納納1.5
是卡納納模型家族的新版本,與上一版本相比,在編碼、數學和函數調用能力方面有了顯著提升,能夠更好地應用於更復雜的實際問題。這個新版本原生支持處理長達32K的標記長度,使用YaRN技術時可處理長達128K的標記,使模型在處理長篇文檔或進行長時間對話時能夠保持連貫性。此外,通過精細的後訓練過程,卡納納1.5能夠實現更自然、準確的對話。
⚠️ 重要提示
預訓練和後訓練數據均不包含Kakao用戶數據。
📊 性能表現
基礎模型評估
模型 |
MMLU |
KMMLU |
HAERAE |
HumanEval |
MBPP |
GSM8K |
卡納納-1.5-2.1B |
56.30 |
45.10 |
77.46 |
52.44 |
47.00 |
55.95 |
卡納納-納米-2.1B |
54.83 |
44.80 |
77.09 |
31.10 |
46.20 |
46.32 |
指令模型評估
模型 |
MT-Bench |
KoMT-Bench |
IFEval |
HumanEval+ |
MBPP+ |
GSM8K (0-shot) |
MATH |
MMLU (0-shot, CoT) |
KMMLU (0-shot, CoT) |
FunctionChatBench |
卡納納-1.5-2.1B* |
7.01 |
6.54 |
68.61 |
68.90 |
65.08 |
81.43 |
60.62 |
53.87 |
32.93 |
53.70 |
卡納納-納米-2.1B |
6.40 |
5.90 |
71.97 |
63.41 |
62.43 |
72.32 |
29.26 |
52.48 |
38.51 |
26.10 |
⚠️ 重要提示
* 根據Apache 2.0許可發佈的模型與其他模型相比,是在最新版本上進行訓練的。
👥 貢獻者
- 語言模型訓練:樸允珠、鄭道海、金保燮、金娜妍、李鎬鎮、樸在善、柳敏鎬
- 語言模型對齊:韓智妍、鄭承宰、金賢浩、高賢雄、李昌民、南元泰
- AI工程:金有民、金亨柱
📝 引用方式
@misc{kananallmteam2025kananacomputeefficientbilinguallanguage,
title={Kanana: Compute-efficient Bilingual Language Models},
author={Kanana LLM Team and Yunju Bak and Hojin Lee and Minho Ryu and Jiyeon Ham and Seungjae Jung and Daniel Wontae Nam and Taegyeong Eo and Donghun Lee and Doohae Jung and Boseop Kim and Nayeon Kim and Jaesun Park and Hyunho Kim and Hyunwoong Ko and Changmin Lee and Kyoung-Woon On and Seulye Baeg and Junrae Cho and Sunghee Jung and Jieun Kang and EungGyun Kim and Eunhwa Kim and Byeongil Ko and Daniel Lee and Minchul Lee and Miok Lee and Shinbok Lee and Gaeun Seo},
year={2025},
eprint={2502.18934},
archivePrefix={arXiv},
primaryClass={cs.CL},
url={https://arxiv.org/abs/2502.18934},
}
☎️ 聯繫方式
- 卡納納大語言模型團隊技術支持:kanana-llm@kakaocorp.com
- 商務合作聯繫:alpha.k@kakaocorp.com
📄 許可證
本項目採用Apache 2.0許可證。