# 學術研究專用

Llm Jp 3.1 1.8b Instruct4
Apache-2.0
由日本國立情報學研究所開發的大語言模型,基於LLM-jp-3構建,通過指令預訓練技術顯著提升了遵循指令的能力。
大型語言模型 Transformers 支持多種語言
L
llm-jp
165
3
Proofgpt V0.1 6.7B
MIT
ProofGPT-v0.1 是一個基於 GPT-NeoX 架構、擁有 67 億參數的語言模型,訓練數據來源於 proof-pile 數據集。
大型語言模型 Transformers 英語
P
hoskinson-center
168
10
Olmo 2 0425 1B SFT
Apache-2.0
OLMo 2 1B SFT是基於OLMo-2-0425-1B模型的監督微調版本,在Tulu 3數據集上訓練,旨在實現多種任務的最先進性能。
大型語言模型 Transformers 英語
O
allenai
1,759
2
Gams 27B Instruct
GaMS-27B-Instruct是基於谷歌Gemma 2系列改進的多語言大語言模型,特別針對斯洛文尼亞語等巴爾幹半島語言優化
大型語言模型 Safetensors
G
cjvt
4,492
1
Gams 9B Instruct GGUF
GaMS-9B-Instruct是基於Google Gemma 2系列開發的斯洛文尼亞語大語言模型,支持斯洛文尼亞語、英語及部分南斯拉夫語系語言。
大型語言模型 支持多種語言
G
tknez
81
2
F5 TTS Vietnamese 100h
基於F5-TTS微調的緊湊版本,訓練數據為150小時的越南語語音,僅限研究用途。
語音合成 其他
F
hynt
123
14
Llama 3.2 3B NuminaQA
Apache-2.0
基於FineMath-Llama-3B微調的3B參數問答模型,使用Numia-1.5問答數據集訓練
大型語言模型 Transformers
L
lkevinzc
330
3
Herald Translator
Apache-2.0
Herald是一個自然語言標註的Lean 4數據集,主要用於自然語言處理和形式化驗證領域的研究。
大型語言模型 Transformers
H
FrenzyMath
1,837
1
C4ai Command R7b 12 2024 Abliterated GGUF
這是c4ai-command-r7b-12-2024-abliterated模型的量化版本,使用llama.cpp進行量化,支持多種量化類型,適用於不同硬件環境。
大型語言模型 支持多種語言
C
bartowski
867
13
VARCO VISION 14B HF
VARCO-VISION-14B是一款強大的英韓視覺語言模型,支持圖像和文本輸入,生成文本輸出,具備定位、指代和OCR功能。
圖像生成文本 Transformers 支持多種語言
V
NCSOFT
449
24
Llavaguard V1.2 0.5B OV
LlavaGuard是基於視覺語言模型的安全評估守護者,主要用於圖像內容的安全分類和違規檢測。
圖像生成文本
L
AIML-TUDA
239
2
Llavaguard V1.2 7B OV
LlavaGuard是基於視覺語言模型的安全評估系統,主要用於圖像內容的安全分類和合規性檢查。
圖像生成文本
L
AIML-TUDA
193
2
Moirai Moe 1.0 R Small
一個基於PyTorch的時間序列預測預訓練模型,適用於多種時序數據分析任務
氣候模型
M
Salesforce
130.92k
8
Moirai Moe 1.0 R Base
這是一個預訓練的時間序列預測模型,專注於時序數據分析與預測任務。
氣候模型 Safetensors
M
Salesforce
374.41k
9
Llavaguard V1.2 7B OV Hf
LlavaGuard是基於視覺語言模型的安全評估系統,用於圖像內容的安全分類和合規性檢查。
圖像生成文本
L
AIML-TUDA
1,148
5
Llama 3.1 SauerkrautLM 70b Instruct AWQ
Apache-2.0
Wisperlama是由DFG資助的Wispermed小組博士生團隊開發的文本生成模型,基於Llama-3.1架構優化。
大型語言模型 Safetensors 支持多種語言
L
WisPerMed
136
5
Tucano 2b4
Apache-2.0
Tucano-2b4是一個專門針對葡萄牙語進行原生預訓練的大規模語言模型,基於變換器架構,在2000億標記的GigaVerbo數據集上訓練。
大型語言模型 Transformers 其他
T
TucanoBR
1,478
4
Llammlein 1B
其他
這是一個基於Tinyllama代碼框架、使用RedPajama V2德語語料從頭訓練的德語Tinyllama 1B語言模型。
大型語言模型 Transformers 德語
L
LSX-UniWue
304
14
Plamo 100b
其他
由Preferred Elements公司基於英日雙語開源數據集訓練的千億參數模型,提供商業與非商業雙重許可
大型語言模型 Transformers 支持多種語言
P
pfnet
178
18
Cambrian 8b
Apache-2.0
寒武紀是一個開源的以視覺為核心設計的 multimodal LLM(多模態大語言模型)。
文本生成圖像 Transformers
C
nyu-visionx
565
63
Moirai 1.1 R Large
Moirai-1.1-R是Salesforce推出的時間序列預測基礎模型,針對低頻數據預測性能顯著提升。
氣候模型 Transformers
M
Salesforce
14.11k
26
Moirai 1.1 R Base
Moirai-1.0-R模型的全新升級版本,在Monash知識庫的40個數據集上取得顯著進步,特別針對低頻數據場景優化。
氣候模型 Transformers
M
Salesforce
26.77k
7
Moirai 1.1 R Small
Moirai-1.1-R是Salesforce發佈的時間序列預測基礎模型,在低頻數據(如年數據和季度數據)上表現優異,相比前代模型性能提升約20%。
氣候模型 Transformers
M
Salesforce
14.61k
6
Brahmai Clip V0.1
MIT
基於ViT-L/14和掩碼自注意力Transformer的CLIP模型,用於零樣本圖像分類研究
文本生成圖像 Transformers 英語
B
brahmairesearch
12.53k
0
Latxa 7b V1.2
Latxa是基於LLaMA-2架構的巴斯克語大語言模型,專為低資源語言設計,在42億token的巴斯克語料庫上訓練
大型語言模型 Transformers 支持多種語言
L
HiTZ
875
5
Llavaguard 7B
LlavaGuard是基於視覺語言模型的數據集安全評估與保障框架,主要用於內容安全評估。
圖像生成文本 Transformers
L
AIML-TUDA
64
10
Llama 3 8B SFR SFT R
基於LLaMA-3-8B的監督微調模型,由Salesforce開發,用於強化學習人類反饋(RLHF)工作流程中的監督微調階段。
大型語言模型 Transformers
L
Salesforce
22
8
Llamantino 3 ANITA 8B Inst DPO ITA
LLaMAntino-3-ANITA是基於Meta Llama 3構建的多語言(英語+意大利語)大型語言模型,專為意大利語NLP任務優化。
大型語言模型 Transformers 支持多種語言
L
swap-uniba
6,401
25
Minerva 1B Base V1.0
Apache-2.0
Minerva-1B-base-v1.0是由Sapienza NLP與FAIR及CINECA合作開發的10億參數意英雙語大語言模型,基於2000億token(各1000億意/英)訓練
大型語言模型 Transformers 支持多種語言
M
sapienzanlp
551
28
Dictalm2.0 Instruct
Apache-2.0
基於DictaLM-2.0的指令微調大語言模型,專為希伯來語和英語聊天場景優化
大型語言模型 Transformers 支持多種語言
D
dicta-il
9,977
22
Cner Base
CNER模型是一個基於DeBERTa-v3-base架構的命名實體識別模型,能夠聯合識別和分類帶有細粒度標籤的概念和命名實體。
序列標註 Transformers 英語
C
Babelscape
20.66k
6
Dictabert Sentiment
專為希伯來語打造的尖端語言模型,基於BERT架構的情感分析模型
文本分類 Transformers 其他
D
dicta-il
1,242
1
Qra 1b
Apache-2.0
Qra是由波蘭國家信息處理研究所與格但斯克理工大學聯合開發的波蘭語優化大語言模型系列,基於TinyLlama-1.1B初始化並在900億波蘭語token上訓練
大型語言模型 Transformers
Q
OPI-PG
246
20
Llava V1.6 Vicuna 7b Gguf
Apache-2.0
LLaVA是一個開源的多模態聊天機器人,通過在多模態指令跟隨數據上微調LLM訓練而成。該版本是GGUF量化版本,提供了多種量化選項。
文本生成圖像
L
cjpais
493
5
Llava V1.6 34b
Apache-2.0
LLaVA是一個開源的多模態聊天機器人,基於大語言模型微調訓練而成,支持圖像和文本的交互。
文本生成圖像
L
liuhaotian
9,033
351
TURNA
其他
TURNA是一個基於UL2框架的土耳其語言模型,適用於理解和生成任務,在多項土耳其語任務中表現優異。
大型語言模型 Transformers 其他
T
boun-tabi-LMG
187
75
UNA TheBeagle 7b V1
TheBeagle是基於The Bagel數據集訓練的70億參數模型,採用DPO(直接偏好優化)和UNA(統一神經架構)技術優化,在多任務中表現優異。
大型語言模型 Transformers
U
fblgit
88
37
Teenytinyllama 460m
Apache-2.0
TeenyTinyLlama-460m是一個針對巴西葡萄牙語優化的開源微型語言模型,參數規模為460M,基於Transformer架構預訓練。
大型語言模型 其他
T
nicholasKluge
289
11
Phi 2 Arxiv Physics Instruct
Apache-2.0
基於Phi-2架構的物理領域問答模型,專門針對arXiv物理學論文內容進行指令微調
大型語言模型 Transformers 英語
P
AlgorithmicResearchGroup
15
3
Llamantino 2 7b Hf ITA
基於LLaMA 2的意大利語適配大語言模型,專注於意大利語文本生成任務
大型語言模型 Transformers 其他
L
swap-uniba
4,696
7
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase