🚀 Orbita-v0.1
Orbita-v0.1 是一款土耳其大语言模型,在土耳其语的多个维度上具备多种能力,涵盖编码、数学等各类任务。它是基于 Qwen 的大语言模型(LLM)的扩展版本,专为土耳其语设计。该模型在经过精心注释的土耳其语清洁数据集上进行训练,能够准确、有条理地执行土耳其语指令。
🚀 快速开始
Orbita-v0.1 是一款土耳其大语言模型,在土耳其语的多个维度上展现出多种能力,可处理诸如编码、数学等各类任务。它是基于 Qwen 14B 的大语言模型的扩展版本,专为土耳其语定制。该模型在经过精心注释的土耳其语数据集上进行了全面微调,以确保能够准确、有条理地执行土耳其语指令。
✨ 主要特性
- 多维度能力:在土耳其语的多个维度上具备多种能力,可处理编码、数学等各类任务。
- 基于 Qwen 扩展:是 Qwen 14B 大语言模型的扩展版本,为土耳其语量身定制。
- 精确执行指令:在精心注释的土耳其语数据集上训练,能准确、有条理地执行土耳其语指令。
📦 安装指南
暂未提供相关安装步骤。
💻 使用示例
基础用法
from transformers import AutoModelForCausalLM, AutoTokenizer
device = "cuda"
model = AutoModelForCausalLM.from_pretrained(
"Orbina/Orbita-v0.1",
torch_dtype="auto",
device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained("Orbina/Orbita-v0.1")
prompt = "Python'da ekrana 'Merhaba Dünya' nasıl yazılır?"
messages = [
{"role": "system", "content": "Sen, Orbina AI tarafından üretilen ve verilen talimatları takip ederek en iyi cevabı üretmeye çalışan yardımcı bir yapay zekasın."},
{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)
generated_ids = model.generate(
model_inputs.input_ids,
temperature=0.3,
top_k=50,
top_p=0.9,
max_new_tokens=512,
repetition_penalty=1,
)
generated_ids = [
output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
高级用法
以下是一些使用该模型进行文本生成的示例:
示例 1
Prompt:
Türkiye'deki finansal kurumlar, yapay zeka ile birlikte gelen veri güvenliği risklerini nasıl yönetiyor, 3 örnek verir misin?
Cevap:
Türkiye'deki finansal kurumlar, yapay zeka (AI) teknolojilerinin getirdiği veri güvenliği riskleri çeşitli yöntemlerle ele almakta ve bu riskleri azaltmaya çalışmaktadır. İşte üç örnek:
1. **Veri Şifreleme:** Finansal kuruluşlar, müşteri bilgileri gibi hassas verileri şifrelemeyi kullanarak veri ihlallerine karşı koruma sağlar. AES (Advanced Encryption Standard), RSA (Rivest-Shamir-Adleman) veya ECC (Elliptik Eğri Kriptografisi) gibi güçlü şifreleme algoritmaları, verilerin okunmasını engelleyebilir.
2. **Anomali Tespit Sistemleri:** Yapay zeka destekli anomali tespit sistemleri, beklenmedik davranışları algılayabilir ve güvenlik ekiplerini uyarır. Bu sistemler, makine öğrenimi modelleri sayesinde zaman içinde daha etkili hale gelebilir ve dolandırıcılık faaliyetlerini önlemede önemli rol oynar.
3. **Sürekli İzleme ve Güvenlik Politikası Uygulama:** Türkiye'deki finansal kurumlar, sürekli izleme ve güvenlik politikalarını uygularak veri güvenliğini sürdürür. Bu süreçlerde düzenli güvenlik denetimleri yapılır ve tüm personelin güvenlik konusunda eğitildiği göz önünde bulundurulur. Ayrıca, müşterilere de güvenlik protokollerini anlatan eğitimler sunulur.
Bu örnekler, Türkiye'deki finansal kurumların yapay zeka ile ilgili veri güvenliği risklerini yönetmek için kullandıkları bazı stratejileri göstermektedir. Ancak herhangi bir güvenlik sistemi mükemmel değildir ve bu nedenle kurumlar da sürekli olarak güvenlik durumlarını değerlendirip iyileştirmeler yapmaktadırlar.
示例 2
Prompt:
Python'da ekrana "Merhaba Dünya" nasıl yazılır?
Cevap:
Python'da ekrana "Merhaba Dünya" yazmak için `print` fonksiyonunu kullanabilirsiniz. İşte basit bir örnek:
``python
print("Merhaba Dünya")
``
Bu kodu çalıştırdığınızda, konsol ekranında "Merhaba Dünya" metnini göreceksiniz. `print` fonksiyonu, verilen argümanı (bu durumda "Merhaba Dünya") alır ve onu çıktı olarak verir.
📚 详细文档
模型详情
属性 |
详情 |
基础模型 |
基于 Qwen 14B 的大语言模型 |
训练数据集 |
经过注释的土耳其语数据集 |
训练方法 |
全量微调 |
评估结果
Open LLM Turkish Leaderboard 评估结果
指标 |
值 |
平均值 |
49.47 |
AI2 Reasoning Challenge_tr |
41.97 |
HellaSwag_tr |
48.00 |
MMLU_tr |
49.51 |
TruthfulQA_tr |
50.78 |
Winogrande _tr |
56.16 |
GSM8k_tr |
50.41 |
📄 许可证
本模型采用 Apache-2.0 许可证。