M

Meltemi 7B V1

由ilsp開發
首個希臘語大型基礎語言模型,基於Mistral-7B架構,通過400億token的希臘語和英語語料增強希臘語能力
下載量 49
發布時間 : 3/22/2024

模型概述

由雅典研究與創新中心下屬的語言與語音處理研究所訓練的首個希臘語大語言模型,支持希臘語和英語,具備文本生成能力

模型特點

希臘語優化
擴展Mistral-7B分詞器以支持希臘語詞彙,通過285億希臘語token增強希臘語能力
雙語能力
在增強希臘語能力的同時保持英語能力,防止災難性遺忘
長上下文支持
支持8192個token的上下文長度
高質量語料
使用嚴格清洗去重的400億token語料庫進行訓練

模型能力

希臘語文本生成
英語文本生成
雙語文本處理

使用案例

教育
希臘語學習輔助
幫助學習者理解和生成希臘語內容
醫療
醫療問答
基於希臘語醫療考試數據集的問答能力
在醫療MCQA希臘語測試集上達到41.0%準確率
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase