🚀 Kyro-n1.1: より賢く、鋭く、高性能なモデル
Kyro-n1.1は、Kyro-n1の強化版です。高度な推論能力、理解力、応答の正確性を備えています。Qwen2.5-7B-Instructをベースに構築され、高度なファインチューニング技術を活用して、複雑なクエリの分析、構造化された応答の提供、より微妙な会話の取り扱い能力を向上させています。
✨ 主な機能
Kyro-n1に対する主要な改善点
- 強化された推論能力:Kyro-n1.1は、より強力な論理的思考を示し、深い分析を必要とするタスクにおいてより信頼性が高いです。
- より正確な応答:洗練されたデータセットの選定と改善されたファインチューニング手法により、事実の一貫性が向上しています。
- 広範なコンテキスト理解:改善されたコンテキスト保持能力により、Kyro-n1.1は多ターンの会話をより首尾一貫して処理できます。
- オープンソースコラボレーションに最適化:Open-Neoイニシアチブの一環として、Kyro-n1.1は透明性が高く、アクセスしやすく、コミュニティ主導のモデルとして設計されています。
Kyro-n1.1を選ぶ理由
- 研究開発に最適:AI推論ベンチマークの探索や独自のプロジェクトの強化など、様々な用途に適しています。
- 様々なユースケースに対応:一般的な質問応答からコーディング支援、創作的な文章作成まで、幅広いアプリケーションに適応します。
- 効率的で拡張可能:計算効率が高く、リソース要件を抑えながら高いパフォーマンスを発揮します。
- 完全なオープンソース:Open-Neoエコシステムの一部として、自由に改変し、様々なワークフローに統合できます。
📦 インストール
Kyro-n1.1 (Qwen2.5) のコードは最新のHugging face transformers
に含まれています。最新バージョンのtransformers
を使用することをお勧めします。
transformers<4.37.0
を使用すると、以下のエラーが発生する場合があります。
KeyError: 'qwen2'
💻 使用例
基本的な使用法
from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "open-neo/Kyro-n1.1-7B"
model = AutoModelForCausalLM.from_pretrained(
model_name,
torch_dtype="auto",
device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)
prompt = "What do you think about CRISPR and its effect on the future of humanity?"
messages = [
{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)
generated_ids = model.generate(
**model_inputs,
max_new_tokens=2048
)
generated_ids = [
output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
📚 ドキュメント
技術仕様
Property |
Details |
開発者 |
Spestly (Open-Neo) & Kazex (Open-Neo) & Adversing (Open-Neo) |
モデルタイプ |
Causal Language Models |
トレーニング段階 |
Pretraining & Post-training |
アーキテクチャ |
transformers with RoPE, SwiGLU, RMSNorm, and Attention QKV bias |
パラメータ数 |
7.61B |
パラメータ数 (非埋め込み) |
6.53B |
レイヤー数 |
28 |
アテンションヘッド数 (GQA) |
28 for Q and 4 for KV |
コンテキスト長 |
Full 131,072 tokens and generation 8192 tokens |
引用
もし私たちの作品が役に立った場合は、ぜひ引用していただけると幸いです。
@misc{qwen2.5,
title = {Qwen2.5: A Party of Foundation Models},
url = {https://qwenlm.github.io/blog/qwen2.5/},
author = {Qwen Team},
month = {September},
year = {2024}
}
@article{qwen2,
title={Qwen2 Technical Report},
author={An Yang and Baosong Yang and Binyuan Hui and Bo Zheng and Bowen Yu and Chang Zhou and Chengpeng Li and Chengyuan Li and Dayiheng Liu and Fei Huang and Guanting Dong and Haoran Wei and Huan Lin and Jialong Tang and Jialin Wang and Jian Yang and Jianhong Tu and Jianwei Zhang and Jianxin Ma and Jin Xu and Jingren Zhou and Jinze Bai and Jinzheng He and Junyang Lin and Kai Dang and Keming Lu and Keqin Chen and Kexin Yang and Mei Li and Mingfeng Xue and Na Ni and Pei Zhang and Peng Wang and Ru Peng and Rui Men and Ruize Gao and Runji Lin and Shijie Wang and Shuai Bai and Sinan Tan and Tianhang Zhu and Tianhao Li and Tianyu Liu and Wenbin Ge and Xiaodong Deng and Xiaohuan Zhou and Xingzhang Ren and Xinyu Zhang and Xipin Wei and Xuancheng Ren and Yang Fan and Yang Yao and Yichang Zhang and Yu Wan and Yunfei Chu and Yuqiong Liu and Zeyu Cui and Zhenru Zhang and Zhihao Fan},
journal={arXiv preprint arXiv:2407.10671},
year={2024}
}
@misc{kyro-n1.1,
title={Kyro-n1: Smarter, Sharper, and More Capable },
author={Open-Neo},
howpublished={https://huggingface.co/collections/open-neo/kyro-n1-67ab2e7bbc76a9aab3030c21},
year={2025}
}
📄 ライセンス
参加方法
Kyro-n1.1はコミュニティ主導の取り組みであり、皆様の貢献を歓迎します!ファインチューニング、テスト、フィードバックの提供など、あなたの意見がモデルの未来を形作ります。一緒にOpen-Neoコミュニティに参加して、Kyro-n1.1を改善しましょう!