低計算成本

# 低計算成本

基於Qwen/Qwen2.5-1.5B-Instruct模型進行微調，使用了TinyV獎勵系統，能在高效強化學習（RL）後訓練中提供更準確的獎勵信號，顯著提升RL效率和最終模型性能。

大型語言模型

Swd Large 6 Steps

層級蒸餾（SwD）是一種通過逐步增加生成過程中的空間分辨率來加速擴散模型（DMs）的全新框架。

Race Classification FairFace YOLOv8

基於YOLOv8/YOLO11架構的快速種族分類模型，訓練於FairFace數據集，用於面部種族分類任務。

Final Complete Malicious Url Model

一個基於BERT-LoRA的微調模型，用於高效檢測惡意網址，包括釣魚、惡意軟件和篡改威脅。

Transformers 英語

Indicbart XLSum

IndicBART-XLSum是一個基於多語言獨立腳本IndicBART的序列到序列預訓練模型，專注於印度語言。

大型語言模型

Transformers 其他

Arabictransformer Base

基於漏斗Transformer和ELECTRA目標的高效阿拉伯語模型，計算成本低且性能優越

大型語言模型

Electra Base Generator

ELECTRA是一種通過判別式預訓練的自監督語言表示學習方法，以較低計算成本實現高效訓練。

大型語言模型英語

Araelectra Base Generator

AraELECTRA是一種基於ELECTRA架構的阿拉伯語預訓練語言模型，通過判別式預訓練方法實現高效的語言理解。

大型語言模型

Transformers 阿拉伯語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase