Qwen2.5 0.5B Instruct Gensyn Swarm Peaceful Exotic Butterfly
基於Gensyn/Qwen2.5-0.5B-Instruct的微調版本,採用TRL框架和GRPO算法訓練,適用於指令跟隨任務。
大型語言模型
Transformers

Q
juliannode
16
2
Open Llama 3b V2 Instruct
Apache-2.0
基於LLaMA 3B v2架構的指令微調語言模型,適用於文本生成任務
大型語言模型
Transformers

O
mediocredev
243
6
Remm SLERP L2 13B
ReMM-SLERP是對原始MythoMax-L2-13B的重構版本,採用SLERP技術融合了更新後的多個13B參數模型,包括Chronos-Beluga、Airoboros和Huginn等。
大型語言模型
Transformers

R
Undi95
121
21
Idefics 9b
其他
IDEFICS是一個開源的多模態模型,能夠處理圖像和文本輸入並生成文本輸出,是Deepmind Flamingo模型的開源復現版本。
圖像生成文本
Transformers 英語

I
HuggingFaceM4
3,676
46
Mvp Multi Task
Apache-2.0
MVP多任務模型是基於提示詞的預訓練模型,通過混合標註數據集優化,專為多種自然語言生成任務設計。
大型語言模型
Transformers 支持多種語言

M
RUCAIBox
20
2
Dialogpt Small C3po
DialoGPT是一個基於GPT架構的對話生成模型,專門用於生成自然流暢的對話響應。
對話系統
Transformers

D
limivan
32
1
Dialogpt Small David Mast
DialoGPT 是微軟推出的一個基於 GPT 架構的對話生成模型,專門用於生成類似人類的對話響應。
大型語言模型
Transformers

D
Toadally
26
0
Blenderbot 90M
Apache-2.0
BlenderBot是一個開放域聊天機器人模型,專注於多輪對話和多種對話技能的融合。
對話系統
Transformers 英語

B
facebook
4,669
3
Ke T5 Small
Apache-2.0
基於韓語和英語預訓練的T5模型,支持跨語言知識驅動的響應生成
大型語言模型 支持多種語言
K
KETI-AIR
909
2
Ke T5 Base Ko
Apache-2.0
KE-T5是由韓國電子技術研究院開發的基於T5架構的韓英雙語文本生成模型,支持跨語言知識遷移的對話生成任務。
大型語言模型 韓語
K
KETI-AIR
208
9
Dialogpt Small Ricksanchez
基於DialoGPT架構的對話生成模型,以《瑞克和莫蒂》中的瑞克·桑切斯為角色設定,能夠生成符合角色風格的對話內容。
大型語言模型
Transformers

D
AnthonyNelson
18
1
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98