Kanana 1.5-8b-base開源雙語大模型 - 免費部署，編程數學能力強、長文處理優

首頁

Kanana 1.5 8b Base

由kakaocorp開發

Kanana 1.5是Kakao公司開發的雙語大語言模型，支持英文和韓文，在編程、數學和函數調用能力方面有顯著提升，原生支持32K tokens上下文長度

大型語言模型

Transformers

支持多種語言開源協議:Apache-2.0 #32K長文本處理 #雙語編程增強 #函數調用優化

下載量 432

發布時間 : 4/15/2025

模型概述

Kanana 1.5是Kanana模型家族的新版本，優化了編程、數學和函數調用能力，支持長文本處理，適用於複雜場景

模型特點

增強的編程和數學能力

相比前代模型在編程和數學任務上有顯著提升

長文本處理

原生支持32K tokens上下文長度，通過YaRN技術可擴展至128K tokens

雙語支持

同時支持英文和韓文處理

優化的後訓練流程

實現更自然精準的對話交互

模型能力

文本生成

代碼生成

數學推理

長文檔處理

雙語理解

使用案例

編程輔助

代碼生成

根據自然語言描述生成代碼

HumanEval測試得分61.59

代碼補全

幫助開發者完成代碼片段

MBPP測試得分57.80

數學應用

數學問題解答

解決複雜的數學問題

GSM8K測試得分63.53

長文檔處理

文檔摘要

處理長達32K tokens的文檔並生成摘要

🚀 卡納納 1.5（Kanana 1.5）模型

卡納納 1.5 是卡納納模型家族的新版本，在編碼、數學和函數調用能力方面有顯著提升，能處理更長的文本序列，對話更自然準確，可應用於更復雜的現實問題。

🚀 快速開始

卡納納 1.5 模型在多個方面展現出強大的性能，下面為你詳細介紹其相關信息。

✨ 主要特性

能力提升：Kanana 1.5 作為卡納納模型家族的新版本，在編碼、數學和函數調用能力方面相較於上一版本有顯著提升，能夠應用於更復雜的現實問題。
長文本處理：該版本原生支持處理長達 32K 個標記的文本，使用 YaRN 技術時可處理多達 128K 個標記，在處理長篇文檔或進行長時間對話時能保持連貫性。
對話優化：通過精細的後訓練過程，Kanana 1.5 能實現更自然、準確的對話。

📚 詳細文檔

新聞動態

2025/05/23：發佈了一篇關於 Kanana 1.5 模型的博客文章，併發布了HF 模型權重。
2025/02/27：發佈了技術報告和HF 模型權重。
2025/01/10：發佈了一篇關於 Kanana Nano 模型開發的博客文章。
2024/11/14：發佈了關於 Kanana 模型開發的博客文章（預訓練，後訓練）。
2024/11/06：發佈了一個關於 Kanana 模型開發的演示視頻。

性能表現

基礎模型評估

模型	MMLU	KMMLU	HAERAE	HumanEval	MBPP	GSM8K
Kanana - 1.5 - 8B	64.24	48.94	82.77	61.59	57.80	63.53
Kanana - 8B	64.22	48.30	83.41	40.24	51.40	57.09

指令模型評估

模型	MT - Bench	KoMT - Bench	IFEval	HumanEval+	MBPP+	GSM8K (0 - shot)	MATH	MMLU (0 - shot, CoT)	KMMLU (0 - shot, CoT)	FunctionChatBench
Kanana - 1.5 - 8B*	7.76	7.63	80.11	76.83	67.99	87.64	67.54	68.82	48.28	58.00
Kanana - 8B	7.13	6.92	76.91	62.20	43.92	79.23	37.68	66.50	47.43	17.37

⚠️ 重要提示

根據 Apache 2.0 許可證發佈的模型是與其他模型相比在最新版本上進行訓練的。

32K+ 長度文本處理

目前，上傳到 HuggingFace 的 config.json 配置為處理 32,768 個標記或更短的文本。要處理超過此長度的標記，必須應用 YaRN。通過使用以下參數更新 config.json，可以應用 YaRN 來處理長達 128K 的標記序列：

"rope_scaling": {
    "factor": 4.4,
    "original_max_position_embeddings": 32768,
    "type": "yarn",
    "beta_fast": 64,
    "beta_slow": 2
},

貢獻者

語言模型訓練：Yunju Bak、Doohae Jung、Boseop Kim、Nayeon Kim、Hojin Lee、Jaesun Park、Minho Ryu
語言模型對齊：Jiyeon Ham、Seungjae Jung、Hyunho Kim、Hyunwoong Ko、Changmin Lee、Daniel Wontae Nam
人工智能工程：Youmin Kim、Hyeongju Kim

引用信息

@misc{kananallmteam2025kananacomputeefficientbilinguallanguage,
      title={Kanana: Compute-efficient Bilingual Language Models}, 
      author={Kanana LLM Team and Yunju Bak and Hojin Lee and Minho Ryu and Jiyeon Ham and Seungjae Jung and Daniel Wontae Nam and Taegyeong Eo and Donghun Lee and Doohae Jung and Boseop Kim and Nayeon Kim and Jaesun Park and Hyunho Kim and Hyunwoong Ko and Changmin Lee and Kyoung-Woon On and Seulye Baeg and Junrae Cho and Sunghee Jung and Jieun Kang and EungGyun Kim and Eunhwa Kim and Byeongil Ko and Daniel Lee and Minchul Lee and Miok Lee and Shinbok Lee and Gaeun Seo},
      year={2025},
      eprint={2502.18934},
      archivePrefix={arXiv},
      primaryClass={cs.CL},
      url={https://arxiv.org/abs/2502.18934}, 
}