Llama 3.1 405B Instruct
Llama 3.1是由Meta開發的多語言大語言模型系列,包含8B、70B和405B三種規模,支持多語言文本生成和代碼生成任務。
大型語言模型
Transformers 支持多種語言

L
meta-llama
34.83k
569
Llama 3.2 1B Instruct SpinQuant INT4 EO8
羊駝3.2系列是由Meta開發的多語言大語言模型,包含1B和3B參數規模,針對多語言對話用例進行了優化。
大型語言模型 支持多種語言
L
meta-llama
565
35
Llama 3.1 405B FP8
Meta羊駝3.1是多語言大語言模型集合,包含80億、700億和4050億參數的預訓練及指令調優生成模型,支持8種語言,在行業基準測試中表現優異。
大型語言模型
Transformers 支持多種語言

L
meta-llama
540
115
Gpt2 Large Harmless Reward Model
MIT
基於Anthropic/hh - rlhf無害數據集訓練的GPT2大模型,專門用於有害響應檢測或基於人類反饋的強化學習(RLHF)。
大型語言模型
Transformers

G
Ray2333
1,489
3
Pairrm Hf
MIT
PairRM是一個高效的成對獎勵模型,用於比較和評估大語言模型的輸出質量。它基於DebertaV3架構,專門設計用於識別候選響應之間的細微差異。
大型語言模型
Transformers 英語

P
llm-blender
631
16
Pairrm
MIT
PairRM是一個高效的成對獎勵模型,用於比較和排序大語言模型的輸出候選,支持多種應用場景如RLHF和最佳N採樣。
大型語言模型
Transformers 英語

P
llm-blender
6,004
198
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98