C

Croissantllmbase

由croissantllm開發
CroissantLLM是一個基於3萬億英法雙語token預訓練的13億參數語言模型,旨在為研究和工業社區提供高性能、完全開源的雙語模型。
下載量 901
發布時間 : 1/9/2024

模型概述

CroissantLLM是一個高性能、完全開源的雙語(英語和法語)語言模型,可在消費級本地硬件上流暢運行。模型採用1:1英法預訓練數據比例、定製分詞器以及雙語微調數據集進行本質雙語模型訓練。

模型特點

雙語支持
模型採用1:1英法預訓練數據比例,專門針對英語和法語進行優化。
高性能
模型在消費級本地硬件上也能流暢運行,適合研究和工業應用。
開源透明
模型完全開源,包括代碼庫、檢查點、微調後的聊天模型和優質翻譯模型。
高質量法語數據
訓練數據包含經過人工篩選、高質量且多樣化的法語數據分支。

模型能力

文本生成
雙語翻譯
代碼生成

使用案例

文本生成
雙語翻譯
將英語文本翻譯為法語,或反之。
高質量的翻譯結果,適用於日常和專業場景。
代碼生成
根據提示生成代碼片段。
適用於開發者和研究人員。
研究
多語言模型研究
用於研究語言模型在多語言環境下的表現。
提供豐富的雙語數據和模型檢查點。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase