Fr Wiki Mlm 13
基於Transformers庫微調的語言模型,具體訓練數據集未明確說明
大型語言模型
Transformers

F
fpadovani
32
1
Allegro T2V 40x720P
Apache-2.0
Allegro是一款開源的高質量文本到視頻生成模型,能夠生成2至6秒、15 FPS的詳細視頻,支持多種分辨率。
文本生成視頻 英語
A
rhymes-ai
21
2
Test Patchtst
Apache-2.0
PatchTST是一個預訓練的時間序列基礎模型,專注於時間序列預測任務。
氣候模型
T
ibm-research
5,593
0
Viking 7B
Apache-2.0
維京7B是一個70億參數的Transformer模型,專注於處理芬蘭語、北歐語言及編程代碼,基於2萬億token訓練。
大型語言模型
Transformers 支持多種語言

V
LumiOpen
2,000
42
Mamba 3B Slimpj
Apache-2.0
基於Mamba架構的3B參數規模的語言模型,支持英文文本生成任務。
大型語言模型
Transformers 英語

M
Q-bert
56
3
Hyenadna Small 32k Seqlen Hf
Bsd-3-clause
HyenaDNA是一個長距離基因組基礎模型,在單核苷酸分辨率下預訓練了長達100萬個標記的上下文長度。
分子模型
Transformers 其他

H
LongSafari
2,885
2
Perceiver Ar Sam Giant Midi
Apache-2.0
基於Perceiver AR架構的符號音頻模型,在GiantMIDI-Piano數據集上預訓練,用於符號音頻生成
音頻生成
Transformers

P
krasserm
153
11
Timesformer Hr Finetuned K600
TimeSformer是一種基於時空注意力機制的視頻理解模型,高分辨率變體專門針對Kinetics-600數據集進行了微調。
視頻處理
Transformers

T
fcakyon
22
0
Pino Bigbird Roberta Base
Pino是基於BigBird架構的荷蘭語預訓練模型,採用稀疏注意力機制處理長序列文本,支持最長4096的序列長度。
大型語言模型 其他
P
flax-community
17
2
Gpt2 Chinese Lyric
基於GPT2架構的中文歌詞生成模型,專為中文歌詞創作優化
大型語言模型 中文
G
uer
536
31
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98