高效蒸餾模型

# 高效蒸餾模型

FairyR1-32B是一款高效的大型語言模型，基於DeepSeek-R1-Distill-Qwen-32B，通過優化的蒸餾與合併流程，在數學和編程任務上表現優異。

大型語言模型

Transformers 英語

Deepseek R1 Chinese Law

基於Unsloth和Huggingface TRL庫訓練的Llama模型，推理速度提升2倍

大型語言模型

Transformers 英語

基於Unsloth和Huggingface TRL庫訓練的Llama模型，推理速度提升2倍

大型語言模型

Transformers 英語

Akshara 8B Llama Multilingual V0.1

Akshara-8B是專為印度多元語言生態打造的尖端AI模型，支持多種印度語言文本的理解與生成。

大型語言模型

Transformers 支持多種語言

SVECTOR-CORPORATION

基於Mistral架構的24B參數模型，通過從DeepSeek模型蒸餾而來，旨在實現快速高效。

大型語言模型

Kotoba Whisper V2.0

Kotoba-Whisper是由Asahi Ushio與Kotoba Technologies合作開發的日語自動語音識別蒸餾模型，基於Whisper large-v3蒸餾而來，推理速度提升6.3倍。

Transformers 日語

Sts Distilcamembert Base

這是一個基於DistilCamemBERT的法語句子嵌入模型，能夠將句子或段落編碼為768維向量，用於句子相似度計算等任務。

Transformers 法語

Distil Small.en

Distil-Whisper是Whisper模型的蒸餾版本，速度快6倍，體積縮小49%，在非分佈評估集上表現接近1% WER。

Transformers 英語

基於SSD-1B與NekorayXL、SDXL-1.0合併優化的動漫風格文生圖模型

ProtBert-UniRef100模型的蒸餾版本，用於蛋白質特徵提取和下游任務微調

蛋白質模型

Minilm L12 H384 Uncased

MiniLM是一種小型高效的預訓練語言模型，通過深度自注意力蒸餾技術壓縮而成，適用於語言理解與生成任務。

大型語言模型

Distilroberta Base

DistilRoBERTa是RoBERTa-base模型的蒸餾版本，參數更少但速度更快，適用於英語文本處理任務。

大型語言模型英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase