C

Charllama 35M

由inkoziev開發
CharLLaMa-35M 是一個微型語言模型,採用LLaMa架構,具有逐字符分詞功能,適用於因BPE分詞導致任務表現不佳時的各類實驗場景。
下載量 61
發布時間 : 8/31/2023

模型概述

該模型專為俄語詩歌實驗開發,預訓練語料包含大量詩歌體文本,參數量為35,913,600,適用於生成式拼寫檢查、文本分類、文本轉錄和拼寫錯誤檢測等任務。

模型特點

逐字符分詞
使用逐字符分詞功能,適用於BPE分詞表現不佳的場景,如拼寫檢查和文本轉錄。
詩歌體文本預訓練
預訓練語料包含大量俄語詩歌體文本,適合詩歌相關任務。
輕量級模型
參數量僅為35,913,600,適合資源有限的實驗場景。

模型能力

文本生成
文本分類
拼寫檢查
文本轉錄
拼寫錯誤檢測

使用案例

文本處理
生成式拼寫檢查器
利用逐字符分詞功能,檢測和糾正拼寫錯誤。
文本分類
替代TfidfVectorizer(analyzer='char'),在字符級n-gram基線表現良好的場景中使用。
文本轉錄
適用於需要逐字符處理的文本轉錄任務。
詩歌生成
俄語詩歌生成
利用預訓練的詩歌體文本生成俄語詩歌。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase