# 長序列建模

Fr Wiki Mlm 13
基於Transformers庫微調的語言模型,具體訓練數據集未明確說明
大型語言模型 Transformers
F
fpadovani
32
1
Allegro T2V 40x720P
Apache-2.0
Allegro是一款開源的高質量文本到視頻生成模型,能夠生成2至6秒、15 FPS的詳細視頻,支持多種分辨率。
文本生成視頻 英語
A
rhymes-ai
21
2
Test Patchtst
Apache-2.0
PatchTST是一個預訓練的時間序列基礎模型,專注於時間序列預測任務。
氣候模型
T
ibm-research
5,593
0
Viking 7B
Apache-2.0
維京7B是一個70億參數的Transformer模型,專注於處理芬蘭語、北歐語言及編程代碼,基於2萬億token訓練。
大型語言模型 Transformers 支持多種語言
V
LumiOpen
2,000
42
Mamba 3B Slimpj
Apache-2.0
基於Mamba架構的3B參數規模的語言模型,支持英文文本生成任務。
大型語言模型 Transformers 英語
M
Q-bert
56
3
Hyenadna Small 32k Seqlen Hf
Bsd-3-clause
HyenaDNA是一個長距離基因組基礎模型,在單核苷酸分辨率下預訓練了長達100萬個標記的上下文長度。
分子模型 Transformers 其他
H
LongSafari
2,885
2
Perceiver Ar Sam Giant Midi
Apache-2.0
基於Perceiver AR架構的符號音頻模型,在GiantMIDI-Piano數據集上預訓練,用於符號音頻生成
音頻生成 Transformers
P
krasserm
153
11
Timesformer Hr Finetuned K600
TimeSformer是一種基於時空注意力機制的視頻理解模型,高分辨率變體專門針對Kinetics-600數據集進行了微調。
視頻處理 Transformers
T
fcakyon
22
0
Pino Bigbird Roberta Base
Pino是基於BigBird架構的荷蘭語預訓練模型,採用稀疏注意力機制處理長序列文本,支持最長4096的序列長度。
大型語言模型 其他
P
flax-community
17
2
Gpt2 Chinese Lyric
基於GPT2架構的中文歌詞生成模型,專為中文歌詞創作優化
大型語言模型 中文
G
uer
536
31
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase