小規模預訓練

# 小規模預訓練

基於Llama架構的5億參數文本生成模型，專為創作故事而設計。

OPENCLIP SigLIP Tiny 14 Distill SigLIP 400m Cc9m

一個基於SigLIP架構的輕量級視覺語言模型，通過蒸餾技術從更大的SigLIP-400m模型中提取知識，適用於零樣本圖像分類任務。

Llama 3.2 400M Amharic

這是一個基於Meta公司Llama-3.2-1B模型的精簡版本，專門針對阿姆哈拉語進行預訓練，包含4億參數，上下文長度為1024個標記。

大型語言模型

Transformers 其他

Vit Betwixt Patch32 Clip 224.tinyclip Laion400m

基於ViT架構的小型CLIP模型，適用於零樣本圖像分類任務，訓練於LAION-400M數據集。

GPT NeoX 1.3B Viet Final GGUF

基於31.3GB越南語數據預訓練的1.3B參數GPT-NeoX模型

大型語言模型英語

TwiBERT是一款專為加納及西非地區廣泛使用的特威語設計的預訓練語言模型

大型語言模型

Transformers 其他

Roberta Base 100M 1

基於1B詞元規模預訓練的RoBERTa基礎模型，驗證困惑度為3.93，適用於英語文本處理任務。

大型語言模型

IT5是首個針對意大利語進行大規模序列到序列Transformer模型預訓練的模型家族，遵循原始T5模型的方法。

大型語言模型其他

Roberta Base 100M 3

在1M至1B詞元規模數據集上預訓練的RoBERTa變體，包含BASE和MED-SMALL兩種規格，適用於資源有限場景下的自然語言處理任務

大型語言模型

Gpt2 Small Indonesian 522M

這是一個基於印尼語維基百科數據預訓練的GPT2-small模型，專注於印尼語文本生成任務。

大型語言模型其他

Roformer Chinese Char Small

RoFormer是基於旋轉位置編碼(Rotary Position Embedding)增強的中文Transformer模型，適用於文本填充任務。

大型語言模型中文

Roberta Med Small 1M 1

基於1M tokens小規模數據預訓練的RoBERTa模型，採用MED-SMALL架構，適用於文本理解任務。

大型語言模型

Roberta Base 10M 1

基於不同規模數據集(1M-1B詞元)預訓練的RoBERTa系列模型，包含BASE和MED-SMALL兩種規格

大型語言模型

Kinyaroberta Small

這是一個基於基尼亞盧旺達語數據集、採用掩碼語言建模（MLM）目標預訓練的RoBERTa模型，使用無大小寫區分標記進行預訓練。

大型語言模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase