I2vgen Xl
MIT
阿里巴巴通義實驗室開發的開源視頻合成代碼庫,集成了多種先進的視頻生成模型
文本生成視頻
I
ali-vilab
4,252
172
Show 1 Sr2
Show-1是一個高效文本生成視頻模型,融合了像素與潛空間擴散模型的優勢,能生成高質量且與文本精準對齊的視頻內容。
視頻處理
S
showlab
127
10
Show 1 Interpolation
Show-1是一個高效的文本生成視頻模型,結合了像素與潛空間擴散模型的優勢,能生成高質量且與文本精準匹配的視頻。
視頻處理
S
showlab
163
3
IF I M V1.0
DeepFloyd IF 是一款基於像素的三級級聯擴散模型,能以當前最優水平生成具有照片級真實感和語言理解能力的圖像。
文本生成圖像
I
DeepFloyd
3,140
55
IF I L V1.0
DeepFloyd-IF是基於像素的三級級聯擴散模型,能以全新水準實現照片級真實感和語言理解。其高效性超越當前最優模型,在COCO數據集上零樣本FID-30K得分達6.66。
文本生成圖像
I
DeepFloyd
4,299
20
IF II M V1.0
DeepFloyd-IF 是一款基於像素的文本到圖像三級級聯擴散模型,能夠生成高真實感和語言理解能力的圖像。
文本生成圖像
I
DeepFloyd
1,293
33
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98