T

Turkish Deepseek

由alibayram開發
基於DeepSeek架構,在土耳其語文本上訓練的語言模型,包含多頭潛在注意力(MLA)和專家混合(MoE)技術。
下載量 106
發布時間 : 5/30/2025

模型概述

一個針對土耳其語優化的語言模型,採用先進的MLA和MoE技術,適用於土耳其語文本生成任務。

模型特點

多頭潛在注意力(MLA)
採用壓縮鍵值表示(秩為256),結合獨立的無位置和位置編碼組件,實現長序列的高效內存使用
專家混合(MoE)
包含4個路由專家和2個共享專家,每個詞元激活2個專家,通過稀疏激活減少計算量
優化的土耳其語處理
專門針對土耳其語訓練,使用土耳其語維基百科數據,詞彙錶針對土耳其語優化
YaRN縮放的旋轉位置編碼
支持頻率縮放的旋轉位置嵌入,能夠擴展超出訓練長度的上下文

模型能力

土耳其語文本生成
長序列處理
高效內存使用

使用案例

文本生成
土耳其語內容創作
生成土耳其語文章、故事或其他創意內容
土耳其語對話系統
構建土耳其語聊天機器人或對話助手
教育
土耳其語學習輔助
幫助學習者練習土耳其語寫作和語法
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase