C

Croissantllmchat V0.1

由croissantllm開發
CroissantLLM是一個基於3T英法雙語token訓練的13億參數語言模型,專為消費級硬件設計,支持流暢的雙語處理。
下載量 3,812
發布時間 : 1/24/2024

模型概述

該模型是CroissantLLM計劃的一部分,經過19萬步訓練(2.99T tokens)及最終聊天微調階段,支持法語和英語的文本生成任務。

模型特點

雙語支持
採用1:1英法預訓練數據配比,專門優化了法語和英語的處理能力。
高效運行
設計用於在消費級硬件上流暢運行,適合研究和工業應用。
高質量法語語料
訓練數據中包含經人工篩選的高質量多樣化法語語料。
透明開源
公開了代碼庫、多個檢查點、微調聊天模型及翻譯模型,透明度標準達標率達81%。

模型能力

文本生成
雙語翻譯
聊天對話
代碼生成

使用案例

語言處理
法語問答
回答關於法國文化、歷史或時事的問題。
在寫作類任務和內部知識檢索上表現良好。
英法翻譯
進行英語和法語之間的翻譯任務。
翻譯任務表現尤為突出。
代碼輔助
代碼生成
生成簡單的代碼片段。
代碼能力有限,適合基礎代碼生成。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase