學術研究專用

# 學術研究專用

Llm Jp 3.1 1.8b Instruct4

由日本國立情報學研究所開發的大語言模型，基於LLM-jp-3構建，通過指令預訓練技術顯著提升了遵循指令的能力。

大型語言模型

Transformers 支持多種語言

Proofgpt V0.1 6.7B

ProofGPT-v0.1 是一個基於 GPT-NeoX 架構、擁有 67 億參數的語言模型，訓練數據來源於 proof-pile 數據集。

大型語言模型

Transformers 英語

hoskinson-center

Olmo 2 0425 1B SFT

OLMo 2 1B SFT是基於OLMo-2-0425-1B模型的監督微調版本，在Tulu 3數據集上訓練，旨在實現多種任務的最先進性能。

大型語言模型

Transformers 英語

Gams 27B Instruct

GaMS-27B-Instruct是基於谷歌Gemma 2系列改進的多語言大語言模型，特別針對斯洛文尼亞語等巴爾幹半島語言優化

大型語言模型

Gams 9B Instruct GGUF

GaMS-9B-Instruct是基於Google Gemma 2系列開發的斯洛文尼亞語大語言模型，支持斯洛文尼亞語、英語及部分南斯拉夫語系語言。

大型語言模型支持多種語言

F5 TTS Vietnamese 100h

基於F5-TTS微調的緊湊版本，訓練數據為150小時的越南語語音，僅限研究用途。

語音合成其他

Llama 3.2 3B NuminaQA

基於FineMath-Llama-3B微調的3B參數問答模型，使用Numia-1.5問答數據集訓練

大型語言模型

Herald Translator

Herald是一個自然語言標註的Lean 4數據集，主要用於自然語言處理和形式化驗證領域的研究。

大型語言模型

C4ai Command R7b 12 2024 Abliterated GGUF

這是c4ai-command-r7b-12-2024-abliterated模型的量化版本，使用llama.cpp進行量化，支持多種量化類型，適用於不同硬件環境。

大型語言模型支持多種語言

VARCO VISION 14B HF

VARCO-VISION-14B是一款強大的英韓視覺語言模型，支持圖像和文本輸入，生成文本輸出，具備定位、指代和OCR功能。

圖像生成文本

Transformers 支持多種語言

Llavaguard V1.2 0.5B OV

LlavaGuard是基於視覺語言模型的安全評估守護者，主要用於圖像內容的安全分類和違規檢測。

圖像生成文本

Llavaguard V1.2 7B OV

LlavaGuard是基於視覺語言模型的安全評估系統，主要用於圖像內容的安全分類和合規性檢查。

圖像生成文本

Moirai Moe 1.0 R Small

一個基於PyTorch的時間序列預測預訓練模型，適用於多種時序數據分析任務

Moirai Moe 1.0 R Base

這是一個預訓練的時間序列預測模型，專注於時序數據分析與預測任務。

Llavaguard V1.2 7B OV Hf

LlavaGuard是基於視覺語言模型的安全評估系統，用於圖像內容的安全分類和合規性檢查。

圖像生成文本

Llama 3.1 SauerkrautLM 70b Instruct AWQ

Wisperlama是由DFG資助的Wispermed小組博士生團隊開發的文本生成模型，基於Llama-3.1架構優化。

大型語言模型

Safetensors 支持多種語言

Tucano-2b4是一個專門針對葡萄牙語進行原生預訓練的大規模語言模型，基於變換器架構，在2000億標記的GigaVerbo數據集上訓練。

大型語言模型

Transformers 其他

這是一個基於Tinyllama代碼框架、使用RedPajama V2德語語料從頭訓練的德語Tinyllama 1B語言模型。

大型語言模型

Transformers 德語

由Preferred Elements公司基於英日雙語開源數據集訓練的千億參數模型，提供商業與非商業雙重許可

大型語言模型

Transformers 支持多種語言

寒武紀是一個開源的以視覺為核心設計的 multimodal LLM（多模態大語言模型）。

文本生成圖像

Moirai 1.1 R Large

Moirai-1.1-R是Salesforce推出的時間序列預測基礎模型，針對低頻數據預測性能顯著提升。

Moirai 1.1 R Base

Moirai-1.0-R模型的全新升級版本，在Monash知識庫的40個數據集上取得顯著進步，特別針對低頻數據場景優化。

Moirai 1.1 R Small

Moirai-1.1-R是Salesforce發佈的時間序列預測基礎模型，在低頻數據（如年數據和季度數據）上表現優異，相比前代模型性能提升約20%。

Brahmai Clip V0.1

基於ViT-L/14和掩碼自注意力Transformer的CLIP模型，用於零樣本圖像分類研究

文本生成圖像

Transformers 英語

brahmairesearch

Latxa是基於LLaMA-2架構的巴斯克語大語言模型，專為低資源語言設計，在42億token的巴斯克語料庫上訓練

大型語言模型

Transformers 支持多種語言

LlavaGuard是基於視覺語言模型的數據集安全評估與保障框架，主要用於內容安全評估。

圖像生成文本

Llama 3 8B SFR SFT R

基於LLaMA-3-8B的監督微調模型，由Salesforce開發，用於強化學習人類反饋（RLHF）工作流程中的監督微調階段。

大型語言模型

Llamantino 3 ANITA 8B Inst DPO ITA

LLaMAntino-3-ANITA是基於Meta Llama 3構建的多語言（英語+意大利語）大型語言模型，專為意大利語NLP任務優化。

大型語言模型

Transformers 支持多種語言

Minerva 1B Base V1.0

Minerva-1B-base-v1.0是由Sapienza NLP與FAIR及CINECA合作開發的10億參數意英雙語大語言模型，基於2000億token（各1000億意/英）訓練

大型語言模型

Transformers 支持多種語言

Dictalm2.0 Instruct

基於DictaLM-2.0的指令微調大語言模型，專為希伯來語和英語聊天場景優化

大型語言模型

Transformers 支持多種語言

CNER模型是一個基於DeBERTa-v3-base架構的命名實體識別模型，能夠聯合識別和分類帶有細粒度標籤的概念和命名實體。

Transformers 英語

Dictabert Sentiment

專為希伯來語打造的尖端語言模型，基於BERT架構的情感分析模型

Transformers 其他

Qra是由波蘭國家信息處理研究所與格但斯克理工大學聯合開發的波蘭語優化大語言模型系列，基於TinyLlama-1.1B初始化並在900億波蘭語token上訓練

大型語言模型

Llava V1.6 Vicuna 7b Gguf

LLaVA是一個開源的多模態聊天機器人，通過在多模態指令跟隨數據上微調LLM訓練而成。該版本是GGUF量化版本，提供了多種量化選項。

文本生成圖像

LLaVA是一個開源的多模態聊天機器人，基於大語言模型微調訓練而成，支持圖像和文本的交互。

文本生成圖像

TURNA是一個基於UL2框架的土耳其語言模型，適用於理解和生成任務，在多項土耳其語任務中表現優異。

大型語言模型

Transformers 其他

UNA TheBeagle 7b V1

TheBeagle是基於The Bagel數據集訓練的70億參數模型，採用DPO（直接偏好優化）和UNA（統一神經架構）技術優化，在多任務中表現優異。

大型語言模型

Teenytinyllama 460m

TeenyTinyLlama-460m是一個針對巴西葡萄牙語優化的開源微型語言模型，參數規模為460M，基於Transformer架構預訓練。

大型語言模型其他

Phi 2 Arxiv Physics Instruct

基於Phi-2架構的物理領域問答模型，專門針對arXiv物理學論文內容進行指令微調

大型語言模型

Transformers 英語

AlgorithmicResearchGroup

Llamantino 2 7b Hf ITA

基於LLaMA 2的意大利語適配大語言模型，專注於意大利語文本生成任務

大型語言模型

Transformers 其他

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase