🚀 Keras模型
本項目是基於Keras構建的圖像到圖像轉換模型,使用了改進的vnet架構,可用於處理2D圖像輸入輸出,具備對抗、美學、質量和過濾等特性。
🚀 快速開始
你可以通過以下鏈接查看訓練日誌:Training logs
✨ 主要特性
- 多種指標評估:使用TopIQ - FR、ArcFace Cosine Distance、VGGFace2 Cosine Distance等指標進行評估。
- 特定數據集:基於logasja/FDF數據集進行訓練。
- 圖像到圖像轉換:適用於圖像到圖像的轉換任務。
- 多種特性:具有對抗、美學、質量和過濾等特性。
📚 詳細文檔
模型描述
該模型使用了改進的vnet進行2D輸入輸出,具體實現可參考此處,其配置如下:
{
"activation": "ReLU",
"batch_norm": false,
"filter_num": [
128,
256,
512,
1024,
1024
],
"n_labels": 3,
"output_activation": "tanh",
"pool": false,
"res_num_ini": 1,
"res_num_max": 3,
"unpool": false
}
訓練配置如下:
{
"alpha": 0.0001,
"batch": 32,
"epochs": 500,
"epsilon": 1,
"input": "(256, 256)",
"losses": {
"FEAT_ArcFace": {
"d": "cosine_similarity",
"f": "ArcFace",
"name": "FEAT_ArcFace",
"reduction": "sum_over_batch_size",
"threshold": 0.68,
"weight": 0.05
},
"FEAT_VGG-Face": {
"d": "cosine_similarity",
"f": "VGG-Face",
"name": "FEAT_VGG-Face",
"reduction": "sum_over_batch_size",
"threshold": 0.68,
"weight": 0.05
},
"IQASSIMC": {
"lower_better": false,
"name": "IQASSIMC",
"reduction": "sum_over_batch_size",
"weight": 0.5
},
"TopIQ": {
"full_ref": true,
"lower_better": false,
"name": "TopIQ",
"reduction": "sum_over_batch_size",
"score_range": "~0, ~1",
"weight": 0.5
}
},
"mixed_precision": true,
"optimizer": {
"amsgrad": false,
"beta_1": 0.9,
"beta_2": 0.999,
"clipnorm": null,
"clipvalue": null,
"ema_momentum": 0.99,
"ema_overwrite_frequency": null,
"epsilon": 1e-07,
"global_clipnorm": null,
"gradient_accumulation_steps": null,
"learning_rate": 9.999999747378752e-05,
"loss_scale_factor": null,
"name": "adamw",
"use_ema": false,
"weight_decay": 0.004
},
"seed": "BIIIIIGSTRETCH",
"testing": 0.01,
"training": 0.99
}
模型架構圖

🔧 技術細節
模型信息
屬性 |
詳情 |
模型類型 |
基於改進vnet的圖像到圖像轉換模型 |
基礎模型 |
vnet、logasja/ArcFace、logasja/VGGFace |
訓練數據 |
logasja/FDF |
評估指標 |
TopIQ - FR、ArcFace Cosine Distance、VGGFace2 Cosine Distance |
組件說明
- 激活函數:使用ReLU激活函數。
- 批歸一化:未使用批歸一化(batch_norm: false)。
- 過濾器數量:包含多個不同數量的過濾器。
- 輸出激活函數:使用tanh作為輸出激活函數。
訓練配置
- 損失函數:使用多種損失函數組合,包括FEAT_ArcFace、FEAT_VGG - Face、IQASSIMC和TopIQ。
- 優化器:使用adamw優化器,並設置了相關參數。
- 訓練輪數:訓練500個epoch。
- 數據集劃分:99%用於訓練,1%用於測試。
📄 許可證
本模型使用GPL - 3.0許可證。