# 自迴歸生成

Janus Pro 7B
MIT
Janus-Pro 是一種新穎的自迴歸框架,統一了多模態理解和生成。它通過解耦視覺編碼路徑,使用單一的統一 Transformer 架構處理多模態任務。
文本生成圖像 Transformers
J
Athagi
15
1
Ankh3 Xl
Ankh3是一個基於T5架構的蛋白質語言模型,通過聯合優化掩碼語言建模和序列補全任務進行預訓練,適用於蛋白質特徵提取和序列分析。
蛋白質模型 Transformers
A
ElnaggarLab
131
2
Kosmos 2 PokemonCards Trl Merged
這是一個基於微軟Kosmos-2模型微調的多模態模型,專門用於識別寶可夢卡牌中的寶可夢名稱。
圖像生成文本 Transformers 英語
K
Mit1208
51
1
Yi Ko 6B
Apache-2.0
Yi-Ko-6B是01-ai/Yi模型的進階版本,通過擴展詞彙表並加入韓語/英語語料進行進一步預訓練,支持韓英雙語文本生成。
大型語言模型 Transformers 支持多種語言
Y
beomi
3,183
37
Goliath 120b
巨人120B是通過合併兩個經過微調的Llama-2 70B模型創建的自迴歸因果語言模型,支持對話式任務。
大型語言模型 Transformers 英語
G
alpindale
620
238
Molgen 7b
Apache-2.0
基於分子語言SELFIES構建的大型分子生成模型,可用於從頭生成分子或補全部分分子結構。
分子模型 Transformers
M
zjunlp
150
8
Xgen 7b 8k Base
Apache-2.0
Salesforce AI Research發佈的7B參數大語言模型,支持8K長序列輸入,基於Apache-2.0協議開源
大型語言模型 Transformers
X
Salesforce
997
318
Musicgen Medium
MusicGen是一款基於文本描述或音頻提示生成高質量音樂樣本的文本轉音樂模型,採用15億參數的自迴歸Transformer架構。
音頻生成 Transformers
M
facebook
1.5M
118
Decapoda Research Llama 7B Hf
其他
LLaMA是Meta AI開發的高效基礎語言模型,提供7B到65B不同參數量級,基於Transformer架構,適用於多種自然語言處理任務。
大型語言模型 Transformers
D
baffo32
12.29k
63
Biomedlm
Openrail
BioMedLM 2.7B 是一個專門針對生物醫學文本訓練的 27 億參數語言模型,在生物醫學 NLP 任務中表現出色。
大型語言模型 Transformers
B
stanford-crfm
14.51k
422
Donut Proto
MIT
Donut是一種無需OCR的文檔理解Transformer模型,結合視覺編碼器和文本解碼器處理圖像到文本的轉換
圖像生成文本 Transformers
D
naver-clova-ix
30
7
Donut Base
MIT
Donut是一種無需OCR的文檔理解Transformer模型,由視覺編碼器(Swin Transformer)和文本解碼器(BART)組成。
圖像生成文本 Transformers
D
naver-clova-ix
50.34k
207
Assignment1 Maria
MIT
s2t-small-librispeech-asr 是一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型,基於序列到序列的轉換器架構。
語音識別 Transformers 英語
A
Classroom-workshop
23
0
Assignment1 Joane
MIT
一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型
語音識別 Transformers 英語
A
Classroom-workshop
22
0
Assignment1 Jack
MIT
一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型,基於序列到序列轉換器架構
語音識別 Transformers 英語
A
Classroom-workshop
24
0
Assignment1 Jane
MIT
s2t-small-librispeech-asr 是一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型,基於序列到序列轉換器架構。
語音識別 Transformers 英語
A
Classroom-workshop
29
0
S2t Large Librispeech Asr
MIT
一個用於自動語音識別(ASR)的端到端序列到序列轉換器模型,基於LibriSpeech數據集訓練
語音識別 Transformers 英語
S
facebook
422
10
S2t Small Librispeech Asr
MIT
一個用於自動語音識別(ASR)的語音到文本轉換器(S2T)模型,基於序列到序列轉換器架構
語音識別 Transformers 英語
S
facebook
10.92k
27
Fr Boris
MIT
Boris 是一個基於 GPT-J 架構、擁有60億參數的自迴歸語言模型,專注於法語文本處理。
大型語言模型 Transformers 法語
F
Cedille
3,085
39
Rebel Large
REBEL是一種基於BART的序列到序列模型,用於端到端關係抽取,支持200多種不同關係類型。
知識圖譜 Transformers 英語
R
Babelscape
37.57k
219
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase