🚀 Orbita-v0.1
Orbita-v0.1 是一款土耳其大語言模型,在土耳其語的多個維度上具備多種能力,涵蓋編碼、數學等各類任務。它是基於 Qwen 的大語言模型(LLM)的擴展版本,專為土耳其語設計。該模型在經過精心註釋的土耳其語清潔數據集上進行訓練,能夠準確、有條理地執行土耳其語指令。
🚀 快速開始
Orbita-v0.1 是一款土耳其大語言模型,在土耳其語的多個維度上展現出多種能力,可處理諸如編碼、數學等各類任務。它是基於 Qwen 14B 的大語言模型的擴展版本,專為土耳其語定製。該模型在經過精心註釋的土耳其語數據集上進行了全面微調,以確保能夠準確、有條理地執行土耳其語指令。
✨ 主要特性
- 多維度能力:在土耳其語的多個維度上具備多種能力,可處理編碼、數學等各類任務。
- 基於 Qwen 擴展:是 Qwen 14B 大語言模型的擴展版本,為土耳其語量身定製。
- 精確執行指令:在精心註釋的土耳其語數據集上訓練,能準確、有條理地執行土耳其語指令。
📦 安裝指南
暫未提供相關安裝步驟。
💻 使用示例
基礎用法
from transformers import AutoModelForCausalLM, AutoTokenizer
device = "cuda"
model = AutoModelForCausalLM.from_pretrained(
"Orbina/Orbita-v0.1",
torch_dtype="auto",
device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained("Orbina/Orbita-v0.1")
prompt = "Python'da ekrana 'Merhaba Dünya' nasıl yazılır?"
messages = [
{"role": "system", "content": "Sen, Orbina AI tarafından üretilen ve verilen talimatları takip ederek en iyi cevabı üretmeye çalışan yardımcı bir yapay zekasın."},
{"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(device)
generated_ids = model.generate(
model_inputs.input_ids,
temperature=0.3,
top_k=50,
top_p=0.9,
max_new_tokens=512,
repetition_penalty=1,
)
generated_ids = [
output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]
response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
高級用法
以下是一些使用該模型進行文本生成的示例:
示例 1
Prompt:
Türkiye'deki finansal kurumlar, yapay zeka ile birlikte gelen veri güvenliği risklerini nasıl yönetiyor, 3 örnek verir misin?
Cevap:
Türkiye'deki finansal kurumlar, yapay zeka (AI) teknolojilerinin getirdiği veri güvenliği riskleri çeşitli yöntemlerle ele almakta ve bu riskleri azaltmaya çalışmaktadır. İşte üç örnek:
1. **Veri Şifreleme:** Finansal kuruluşlar, müşteri bilgileri gibi hassas verileri şifrelemeyi kullanarak veri ihlallerine karşı koruma sağlar. AES (Advanced Encryption Standard), RSA (Rivest-Shamir-Adleman) veya ECC (Elliptik Eğri Kriptografisi) gibi güçlü şifreleme algoritmaları, verilerin okunmasını engelleyebilir.
2. **Anomali Tespit Sistemleri:** Yapay zeka destekli anomali tespit sistemleri, beklenmedik davranışları algılayabilir ve güvenlik ekiplerini uyarır. Bu sistemler, makine öğrenimi modelleri sayesinde zaman içinde daha etkili hale gelebilir ve dolandırıcılık faaliyetlerini önlemede önemli rol oynar.
3. **Sürekli İzleme ve Güvenlik Politikası Uygulama:** Türkiye'deki finansal kurumlar, sürekli izleme ve güvenlik politikalarını uygularak veri güvenliğini sürdürür. Bu süreçlerde düzenli güvenlik denetimleri yapılır ve tüm personelin güvenlik konusunda eğitildiği göz önünde bulundurulur. Ayrıca, müşterilere de güvenlik protokollerini anlatan eğitimler sunulur.
Bu örnekler, Türkiye'deki finansal kurumların yapay zeka ile ilgili veri güvenliği risklerini yönetmek için kullandıkları bazı stratejileri göstermektedir. Ancak herhangi bir güvenlik sistemi mükemmel değildir ve bu nedenle kurumlar da sürekli olarak güvenlik durumlarını değerlendirip iyileştirmeler yapmaktadırlar.
示例 2
Prompt:
Python'da ekrana "Merhaba Dünya" nasıl yazılır?
Cevap:
Python'da ekrana "Merhaba Dünya" yazmak için `print` fonksiyonunu kullanabilirsiniz. İşte basit bir örnek:
``python
print("Merhaba Dünya")
``
Bu kodu çalıştırdığınızda, konsol ekranında "Merhaba Dünya" metnini göreceksiniz. `print` fonksiyonu, verilen argümanı (bu durumda "Merhaba Dünya") alır ve onu çıktı olarak verir.
📚 詳細文檔
模型詳情
屬性 |
詳情 |
基礎模型 |
基於 Qwen 14B 的大語言模型 |
訓練數據集 |
經過註釋的土耳其語數據集 |
訓練方法 |
全量微調 |
評估結果
Open LLM Turkish Leaderboard 評估結果
指標 |
值 |
平均值 |
49.47 |
AI2 Reasoning Challenge_tr |
41.97 |
HellaSwag_tr |
48.00 |
MMLU_tr |
49.51 |
TruthfulQA_tr |
50.78 |
Winogrande _tr |
56.16 |
GSM8k_tr |
50.41 |
📄 許可證
本模型採用 Apache-2.0 許可證。