# 多數據集訓練

Icedit Normal Lora
其他
這是一個基於LoRA技術的圖像到圖像轉換模型,主要用於非商業用途的圖像編輯任務。
圖像生成 英語
I
RiverZ
1,046
7
Ritrieve Zh V1 GGUF
MIT
本項目提供了對 richinfoai/ritrieve_zh_v1 模型的靜態量化版本,通過量化處理減少存儲空間和計算資源需求,同時保持一定性能。
大型語言模型 Transformers 中文
R
mradermacher
212
1
Chunkformer Large Vie
基於ChunkFormer架構的大規模越南語自動語音識別模型,在約3000小時的越南語公開語音數據上微調,性能優異。
語音識別 其他
C
khanhld
1,765
12
Bert Uncased Intent Classification
Apache-2.0
這是一個基於BERT的微調模型,用於將用戶輸入分類為82種不同的意圖,適用於對話系統和自然語言理解任務。
文本分類 Transformers 英語
B
yeniguno
1,942
1
Vitpose Plus Large
Apache-2.0
ViTPose++是基於視覺Transformer的人體姿態估計基礎模型,在MS COCO關鍵點測試集上達到81.1 AP的優異表現。
姿態估計 Transformers
V
usyd-community
1,731
1
TIPO 500M Ft
其他
TIPO是基於文本預採樣的提示優化文本轉圖像系統,通過大型語言模型優化用戶輸入提示,提升生成模型的質量與易用性。
文本生成圖像 英語
T
KBlueLeaf
10.92k
29
Vitpose Base Coco Aic Mpii
Apache-2.0
ViTPose是一個基於視覺Transformer的人體姿態估計模型,通過簡單的架構設計在MS COCO等基準上取得了優異表現。
姿態估計 Transformers 英語
V
usyd-community
38
1
Aura 4B GGUF
Apache-2.0
Aura-4B是一個基於AuraIndustries/Aura-4B的量化版本,使用llama.cpp進行imatrix量化,支持多種量化類型,適用於文本生成任務。
大型語言模型 英語
A
bartowski
290
8
Viwhisper Medium
MIT
針對越南語語音識別任務優化的Whisper-medium模型,在1308小時越南語數據上微調
語音識別 Transformers 其他
V
NhutP
139
4
Whisper Ja Anime V0.1
專注於日語動漫領域語音識別的Whisper變體模型,針對動漫音頻特點優化
語音識別 日語
W
efwkjn
205
15
F5 Hindi 24KHz
基於F5架構從頭開始訓練的印地語文本轉語音模型,由印度理工學院馬德拉斯分校SPRING實驗室開發。
語音合成 其他
F
SPRINGLab
1,430
18
Llama3 Aloe 8B Alpha GGUF
Llama3-Aloe-8B-Alpha 是一個專注於生物學和醫學領域的8B參數大語言模型,提供GGUF格式量化版本
大型語言模型 Transformers 英語
L
tensorblock
224
1
Kazrush Ru Kk
Apache-2.0
kazRush-ru-kk 是一個基於T5配置的俄語到哈薩克語的翻譯模型,在多個開源平行數據集上訓練而成。
機器翻譯 Transformers 其他
K
deepvk
332
8
Noobai Xl Nai Xl Epsilonpred10version Sdxl
其他
一個基於SDXL的動漫風格文本生成圖像模型,適合新手使用,能夠生成高質量的動漫角色和風格化圖像。
圖像生成 英語
N
John6666
87
3
Birefnet Matting
BiRefNet是一個基於雙邊參考的高分辨率二分圖像分割模型,專注於背景去除和掩膜生成任務。
圖像分割
B
ZhengPeng7
1,578
18
TIPO 500M
其他
TIPO是一個採用LLaMA架構的5億參數模型,專為文本轉圖像生成中的提示優化而設計。
文本生成圖像 英語
T
KBlueLeaf
2,013
51
Birefnet Lite 2K
高分辨率二分圖像分割的雙邊參考框架,專注於背景去除和掩膜生成任務
圖像分割 Safetensors
B
ZhengPeng7
3,400
8
Rad Dino Maira 2
其他
RAD-DINO-MAIRA-2 是一種基於DINOv2自監督學習訓練的視覺變換器模型,專門用於編碼胸部X光片圖像。
Transformers
R
microsoft
9,414
11
Test Push
Apache-2.0
distilvit是一個基於VIT圖像編碼器和蒸餾版GPT-2文本解碼器的圖像轉文本模型,能夠生成圖像的文本描述。
圖像生成文本 Transformers
T
tarekziade
17
0
Octo Base 1.5
MIT
Octo 是一個用於機器人技術的多模態基礎模型,能夠通過視覺和語言輸入預測機器人動作。
多模態融合 Transformers
O
rail-berkeley
87
14
Rad Dino
其他
基於自監督學習DINOv2訓練的視覺Transformer模型,專門用於編碼胸部X光影像
圖像分類 Transformers
R
microsoft
411.96k
48
Pix2text Table Rec
MIT
基於微軟Table Transformer開發的表格結構識別模型,用於文檔中的表格檢測與識別任務
文字識別 Transformers
P
breezedeus
1,124
2
Japanese Reranker Cross Encoder Large V1
MIT
專為日語文本排序任務優化的交叉編碼器模型,具有24層和1024隱藏層大小的高性能架構
文本嵌入 日語
J
hotchpotch
2,959
15
Japanese Bge Reranker V2 M3 V1
MIT
這是一個日語Reranker(交叉編碼器)模型,用於文本排序任務,具有24層和1024隱藏層大小。
文本嵌入 日語
J
hotchpotch
1,151
15
Japanese Reranker Cross Encoder Small V1
MIT
這是一個日語訓練的Reranker(交叉編碼器)模型,用於文本排序任務。
文本嵌入 日語
J
hotchpotch
209
3
Japanese Reranker Cross Encoder Xsmall V1
MIT
這是一個日語訓練的Reranker(交叉編碼器)模型,用於文本排序任務。
文本嵌入 日語
J
hotchpotch
7,041
7
Whisper Tiny Vi
Apache-2.0
基於OpenAI Whisper-tiny架構微調的越南語自動語音識別(ASR)模型,在多個越南語數據集上表現出色
語音識別 Transformers 其他
W
doof-ferb
44
2
Finance LLM GGUF
其他
Finance LLM 是一個專注於金融領域的語言模型,基於 Llama 架構,經過 OpenOrca、Lima 和 WizardLM 等數據集的微調。
大型語言模型 英語
F
TheBloke
641
21
Deberta V3 Large Mnli Fever Anli Ling Wanli Binary
MIT
該模型是基於DeBERTa-v3-large架構的零樣本分類模型,主要在五個NLI數據集上訓練,適用於遵循原始NLI任務的任務。
文本分類 Transformers 英語
D
MoritzLaurer
30
0
Silver Retriever Base V1.1
銀色檢索器模型將波蘭語句子或段落編碼為768維稠密向量空間,可用於文檔檢索或語義搜索等任務。
文本嵌入 Transformers 其他
S
ipipan
862
9
Pairrm
MIT
PairRM是一個高效的成對獎勵模型,用於比較和排序大語言模型的輸出候選,支持多種應用場景如RLHF和最佳N採樣。
大型語言模型 Transformers 英語
P
llm-blender
6,004
198
Ag Nli DeTS Sentence Similarity V1
Apache-2.0
該模型使用SentenceTransformers的Cross-Encoder類進行訓練,用於預測兩個句子語義相似度的分數。
文本嵌入 Transformers 支持多種語言
A
abbasgolestani
982
0
Wav2vec2 Large Robust 24 Ft Age Gender
該模型以原始音頻信號作為輸入,輸出年齡預測值以及性別概率(兒童/女性/男性),同時輸出最後一層transformer的池化狀態。
音頻分類 Transformers
W
audeering
44.13k
33
Wav2vec2 Large Robust 6 Ft Age Gender
該模型通過微調Wav2Vec2-Large-Robust,能夠從原始音頻中預測說話者的年齡和性別。
音頻分類 Transformers
W
audeering
19.29k
2
Silver Retriever Base V1
Silver Retriever是一個針對波蘭語的神經檢索模型,專門用於句子相似度和段落檢索任務。
文本嵌入 Transformers 其他
S
ipipan
554
11
Gpt2 Bangla Summurizer
這是一個基於GPT2架構的孟加拉語文本摘要生成模型,專門針對新聞內容進行優化。
文本生成 Transformers 其他
G
faridulreza
18
0
All MiniLM L6 V2 Ct2 Int8
Apache-2.0
這是一個基於MiniLM架構的句子嵌入模型,能將文本映射到384維向量空間,適用於語義搜索和文本相似度任務。
文本嵌入 英語
A
jncraton
40
0
Vegam Whisper Medium Ml
MIT
這是將thennal/whisper-medium-ml轉換為CTranslate2模型格式的版本,用於馬拉雅拉姆語語音識別
語音識別 其他
V
smcproject
83
5
Whisper Small Japanese
Apache-2.0
該模型是基於openai/whisper-small微調的日語語音識別模型,支持日語語音轉文本任務。
語音識別 Transformers 日語
W
Ivydata
356
5
Whisper Base Japanese
Apache-2.0
本模型使用Common Voice、JVS和JSUT數據集對openai/whisper-base進行日語微調,適用於日語語音識別任務。
語音識別 Transformers 日語
W
Ivydata
137
3
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase