M

Minerva 1B Base V1.0

由sapienzanlp開發
Minerva-1B-base-v1.0是由Sapienza NLP與FAIR及CINECA合作開發的10億參數意英雙語大語言模型,基於2000億token(各1000億意/英)訓練
下載量 551
發布時間 : 4/19/2024

模型概述

首個完全基於意大利語預訓練的大語言模型家族成員,真正開放的意英雙語基礎模型,未經過對齊處理

模型特點

雙語平衡訓練
採用1000億意大利語token和1000億英語token的平衡訓練數據
高效分詞器
意大利語分詞效率1.39(CulturaX測試),優於同類模型
長上下文支持
支持最大16384 tokens的上下文長度

模型能力

意大利語文本生成
英語文本生成
多任務處理

使用案例

教育
意大利語學習輔助
生成意大利語學習材料和練習題
內容創作
雙語內容生成
自動生成意英雙語的文章或營銷內容
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase