大語言模型優化

# 大語言模型優化

Deepseek R1 0528 FP4

DeepSeek AI 公司的 DeepSeek R1 0528 模型的量化版本，基於優化的 Transformer 架構的自迴歸語言模型，可用於商業和非商業用途。

大型語言模型

Text To Cypher Gemma 3 27B Instruct 2025.04.0

Gemma 3 27B Instruct 是由 Google 開發的大型語言模型，基於 neo4j/text2cypher-2025v1 數據集微調，專注於將自然語言轉換為 Cypher 查詢語言。

大型語言模型

Safetensors 英語

Mistral NeMo Minitron 8B Base

Mistral-NeMo-Minitron-8B-Base是一個基礎的文本生成模型，通過對Mistral-NeMo 12B進行剪枝和蒸餾得到，適用於多種自然語言生成任務。

大型語言模型

Prosparse Llama 2 7b

基於LLaMA-2-7B的激活稀疏化大語言模型，通過ProSparse方法實現高稀疏率(89.32%)且保持原始性能

大型語言模型

Transformers 英語

Bloom Deepspeed Inference Fp16

BLOOM 是一個開源的多語言大語言模型，由 BigScience 項目開發，旨在提供高效的文本生成能力。

大型語言模型

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase