# 合成數據訓練

Smolvlm 500M Anime Caption V0.2
Apache-2.0
專注於描述動漫風格圖像的視覺語言模型,基於SmolVLM-500M-Base微調
圖像生成文本 Safetensors 英語
S
Andres77872
17
0
Phi 4 Mini Reasoning GGUF
MIT
Phi-4-mini-reasoning 是一個基於合成數據構建的輕量級開放模型,專注於高質量、富含推理的數據,並針對更高級的數學推理能力進行了進一步微調。
大型語言模型 Transformers
P
Mungert
3,592
3
Smartshot Zeroshot Finetuned V0.1.2
MIT
基於roberta-base-zeroshot-v2.0-c微調的零樣本分類模型,採用SmartShot方法和合成數據提升性能
文本分類 其他
S
gincioks
119
0
Smolvlm 500M Anime Caption V0.1
Apache-2.0
專注於描述動漫風格圖像的視覺語言模型,基於SmolVLM-500M-Base微調,訓練數據包含18萬組由大語言模型生成的合成圖像/字幕對。
圖像生成文本 英語
S
Andres77872
61
0
Cockatiel 8B
基於VILA-v1.5-8B構建的視頻字幕生成模型,能夠為輸入視頻生成詳細且符合人類偏好的字幕。
視頻生成文本 Transformers
C
Fr0zencr4nE
19
0
Poseless 3B
Apache-2.0
Poseless-3B 是一種基於視覺語言模型(VLM)的機器人手部控制框架,能夠直接將2D圖像映射到關節角度,無需顯式姿態估計。
姿態估計 Transformers
P
Menlo
65
10
Poseless 3B
Apache-2.0
PoseLess是一種創新的機器人手部控制框架,通過使用投影表示直接將2D圖像映射到關節角度,無需顯式的姿態估計。
多模態融合 Transformers
P
homebrewltd
98
7
Gliner Biomed Bi Large V1.0
Apache-2.0
GLiNER-BioMed是基於GLiNER框架的專為生物醫學領域設計的高效開放NER模型套件,能夠識別多種類型的生物醫學實體。
序列標註 英語
G
Ihor
56
1
Gliner Biomed Bi Base V1.0
Apache-2.0
GLiNER-BioMed是基於GLiNER框架的高效開放生物醫學命名實體識別模型套件,專為生物醫學領域設計,能夠識別多種實體類型。
序列標註 英語
G
Ihor
25
1
Gliner Biomed Large V1.0
Apache-2.0
GLiNER-BioMed是基於GLiNER框架的專門高效開放生物醫學NER模型套件,在生物醫學實體識別任務中實現了最先進的零樣本和小樣本性能。
序列標註 PyTorch 英語
G
Ihor
163
6
Gliner Biomed Base V1.0
Apache-2.0
GLiNER-生物醫學版是基於GLiNER框架開發的專用生物醫學命名實體識別模型,能夠識別多種生物醫學實體類型。
序列標註 PyTorch 英語
G
Ihor
61
2
Asagi 8B
Apache-2.0
Asagi-8B是一個大規模的日語視覺與語言模型(VLM),基於廣泛的日語數據集訓練,整合了多樣化的數據來源。
圖像生成文本 Transformers 日語
A
MIL-UT
58
4
Slam Scaled
MIT
在單塊GPU上24小時內訓練出的高質量語音語言模型,基於Qwen2.5-0.5B微調,使用Hubert標記作為詞彙表
音頻生成 Transformers
S
slprl
792
6
Modernbert Large Bias Type Classifier
MIT
基於ModernBERT-large微調的文本分類模型,用於檢測和分類文本中的多種偏見類型。
文本分類 Transformers 英語
M
cirimus
424
2
Asagi 14B
Apache-2.0
Asagi-14B是一個大規模的日語視覺與語言模型(VLM),在廣泛的日語數據集上進行了訓練,整合了多樣化的數據來源。
圖像生成文本 Transformers 日語
A
MIL-UT
83
9
Flux.1 Dev Controlnet Upscaler
其他
由Jasper研究團隊開發的用於低分辨率圖像放大的ControlNet模型
圖像增強
F
R1000
106
3
Multilingual Sentiment Analysis
一個基於DistilBERT微調的多語言情感分析模型,支持21種語言,適用於社交媒體、客戶反饋等多場景分析。
文本分類 Transformers 支持多種語言
M
tabularisai
162.07k
145
Euclid Convnext Xxlarge 120524
Apache-2.0
專為強化低級幾何感知能力訓練的多模態大語言模型,通過合成高保真視覺描述增強幾何分析能力
文本生成圖像 Transformers 英語
E
euclid-multimodal
22
4
Gec Spanish BARTO SYNTHETIC
基於BART架構的西班牙語語法糾錯模型,使用COWS-L2H數據集和80,984條合成數據訓練,專為單句糾錯優化
文本生成 Transformers 支持多種語言
G
SkitCon
118
1
EVA Qwen2.5 72B V0.2
其他
基於Qwen2.5-72B微調的大語言模型,專注於文本生成和指令跟隨任務
大型語言模型 Transformers
E
EVA-UNIT-01
392
19
Mstyledistance
MIT
mStyleDistance是一個多語言風格嵌入模型,旨在將具有相似寫作風格的文本緊密嵌入,不同風格的文本遠離嵌入,不受內容和語言限制。
文本嵌入
M
StyleDistance
207
2
Pegasus X Base Synthsumm Open 16k
Apache-2.0
基於pegasus-x-base微調的文本摘要模型,使用合成數據訓練,擅長處理長文檔摘要任務。
文本生成 Transformers 英語
P
BEE-spoke-data
115
2
Phi 3.5
MIT
Phi-3.5是由Microsoft開發的基於Phi-3架構的先進大語言模型,專注於高質量、富含推理的數據,支持128K標記上下文長度。
大型語言模型
P
cortexso
304
1
Flux.1 Dev Controlnet Upscaler
其他
由Jasper研究團隊開發的用於低分辨率圖像放大的ControlNet模型
圖像增強
F
jasperai
11.16k
710
Reflection Llama 3.1 70B
Reflection Llama-3.1 70B 是一款開源大語言模型,採用'反思調優'技術訓練,能夠自主檢測推理錯誤並修正方向。
大型語言模型 Transformers
R
mattshumer
199
1,712
Depth Anything V2 Metric Indoor Large Hf
基於Depth Anything V2使用合成Hypersim數據集進行室內度量深度估計的微調版本,兼容transformers庫。
3D視覺 Transformers
D
depth-anything
47.99k
9
Depth Anything V2 Metric Indoor Base Hf
基於Depth Anything V2模型,針對室內度量深度估計任務使用Hypersim合成數據集微調的版本
3D視覺 Transformers
D
depth-anything
9,056
1
Depth Anything V2 Metric Indoor Small Hf
基於Depth Anything V2針對室內度量深度估計任務進行微調的模型,使用合成數據集Hypersim訓練,兼容transformers庫。
3D視覺 Transformers
D
depth-anything
750
2
Depth Anything V2 Metric Outdoor Small Hf
基於Depth Anything V2的微調版本,專為戶外場景度量深度估計設計,使用合成數據集Virtual KITTI進行訓練。
3D視覺 Transformers
D
depth-anything
459
1
Depth Anything V2 Metric Outdoor Base Hf
基於Depth Anything V2使用合成Virtual KITTI數據集針對室外度量深度估計任務微調的版本,兼容transformers庫
3D視覺 Transformers
D
depth-anything
436
0
Depth Anything V2 Metric Outdoor Large Hf
Apache-2.0
基於Depth Anything V2針對戶外度量深度估計任務進行微調的版本,使用合成數據集Virtual KITTI進行訓練
3D視覺 Transformers
D
depth-anything
3,662
6
Robust Sentiment Analysis
Apache-2.0
基於distilbert/distilbert-base-uncased微調的情感分析模型,僅使用合成數據訓練,支持5種情感分類。
文本分類 Transformers 英語
R
tabularisai
2,632
14
Styledistance
MIT
StyleDistance是一種風格嵌入模型,旨在將寫作風格相似的文本緊密嵌入,不同風格的文本遠離嵌入,而不受內容影響。
文本嵌入 英語
S
StyleDistance
492
4
Gliclass Large V1.0
Apache-2.0
一款高效的零樣本分類器,基於合成數據訓練,適用於主題分類、情感分析及RAG流程中的重排序任務。
文本分類 Transformers 英語
G
knowledgator
80
5
Gliclass Base V1.0
Apache-2.0
GLiClass是一款高效零樣本分類器,受GLiNER啟發,適用於文本分類、情感分析及RAG流程中的重排序任務。
文本分類 Transformers 英語
G
knowledgator
152
3
Gliclass Base V1.0 Lw
Apache-2.0
GLiClass是一款高效零樣本分類器,基於合成數據訓練,適用於文本分類、情感分析及RAG流程中的重排序任務。
文本分類 Transformers 英語
G
knowledgator
57
2
Gemma 2 9B It SPPO Iter3
基於自博弈偏好優化方法在第三輪迭代中開發的89億參數語言模型,以google/gemma-2-9b-it為起點,使用UltraFeedback數據集進行微調
大型語言模型 Transformers 英語
G
UCLA-AGI
6,704
125
Llama 3 Instruct 8B SPPO Iter3
Apache-2.0
基於Meta-Llama-3-8B-Instruct架構,採用Self-Play Preference Optimization方法在第三次迭代中開發的大語言模型。
大型語言模型 Transformers 英語
L
UCLA-AGI
8,539
83
Qwen2 1.5B Summarize
Apache-2.0
基於Qwen2-1.5B-Instruct模型進行2輪微調的摘要生成專用模型
文本生成 Transformers 英語
Q
thepowerfuldeez
228
1
Gemma
Gemma是一款先進的開源模型,基於高質量數據集訓練,支持不同上下文長度需求。
大型語言模型
G
cortexso
295
1
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase