Model Selection

Few-shot Fine-tuning

# Few-shot Fine-tuning

Logoiconemojimoe V0.2 FLUX.1 Dev LoRA

A LoRA adapter based on the FLUX.1-dev model, specifically designed for generating logos, icons, and emojis, supporting various 3D rendering effects including Microsoft FluentUI style.

Image Generation

Bge Base En V1.5 Course Recommender V5

This is a sentence-transformers model fine-tuned from BAAI/bge-base-en-v1.5, which maps sentences and paragraphs to a 768-dimensional dense vector space.

Test With Sdfvd

A video understanding model fine-tuned based on MCG-NJU/videomae-base, with average performance on the evaluation set (accuracy 50%)

Video Processing

Videomae Base Finetuned 1e 08 Bs4 Ep2

A video understanding model fine-tuned based on MCG-NJU/videomae-base, trained on an unknown dataset

Video Processing

Finetuning Sentiment Model 3000 Samples

A sentiment analysis model fine-tuned based on distilbert-base-uncased, achieving 87.67% accuracy on the evaluation set

Text Classification

Nuke X Gemma3 1B Reasoner Testing

A reasoning-enhanced model optimized from Google Gemma-3-1B, improving logical reasoning capabilities through GRPO algorithm and high-quality datasets

Large Language Model

Transformers English

Learn Hf Food Not Food Text Classifier Distilbert Base Uncased

A DistilBERT-based text classification model for distinguishing between food and non-food texts

Text Classification

HimanshuGoyal2004

Finetuned ViT Model

Hardhat detection model fine-tuned based on DETR-ResNet50 architecture, designed for industrial scenarios

Object Detection

Transformers English

Finetuning Sentiment Model 3000 Samples 1

A sentiment analysis model fine-tuned based on distilbert-base-uncased, achieving an accuracy of 85.67% on the evaluation set

Text Classification

Ddpm Fewshot Anime Face

A diffusion model based on the DDPM architecture for generating cartoon-style character avatars

Image Generation

Florence 2 DocVQA

A version fine-tuned for 1 day using the Docmatix dataset (5% data volume) based on Microsoft's Florence-2 model, suitable for image-text understanding tasks

Paligemma Vqav2

This model is a fine-tuned version of google/paligemma-3b-pt-224 on a subset of the VQAv2 dataset, specializing in visual question answering tasks.

Finetuned Clothes

A clothing classification model fine-tuned based on Google's ViT model, supporting image classification for 7 clothing categories

Image Classification

Intent Classifier

A Flan-T5-Base fine-tuned intent classification model for categorizing customer queries into predefined categories

Text Classification

Metavoice 1B V0.1

MetaVoice-1B is a 1.2 billion parameter text-to-speech (TTS) foundation model trained on 100,000 hours of speech data, specializing in generating emotional English speech with support for voice cloning and long-form synthesis.

Speech Synthesis English

Blip Image Captioning Base Test Sagemaker Tops 3

This model is a fine-tuned version of Salesforce's BLIP image captioning base model on the SageMaker platform, primarily used for image caption generation tasks.

Document image understanding model fine-tuned based on naver-clova-ix/donut-base-finetuned-cord-v2

Donut Base Sroie

A model fine-tuned on an image folder dataset based on naver-clova-ix/donut-base, with no specific use case explicitly stated

Text Recognition

Swinv2 Tiny Patch4 Window8 256 Finetuned THFOOD 50

This model is a vision classification model fine-tuned on the THFOOD-50 Thai food dataset based on the Swin Transformer V2 architecture, specifically designed for Thai food image recognition.

Image Classification

A model fine-tuned based on philschmid/donut-base-sroie, suitable for image processing tasks

Text Recognition

Platzi Vit Model Julio Test

This is an image classification model fine-tuned on a bean dataset based on Google's ViT model, achieving a high accuracy of 99.25% on the validation set.

Image Classification

Swin Tiny Patch4 Window7 224 Finetuned Skin Cancer

A fine-tuned model based on the Swin Transformer architecture, specifically designed for skin cancer image classification tasks

Image Classification

Swin Tiny Patch4 Window7 224 Finetuned Trash Classification

A fine-tuned model based on Swin Transformer architecture for garbage classification tasks, achieving 88.27% accuracy

Image Classification

Swin Small Finetuned Cifar100

A small model based on the Swin Transformer architecture, fine-tuned on the CIFAR-100 dataset for image classification tasks

Image Classification

Donut Base Sroie

A model fine-tuned on the image folder dataset based on naver-clova-ix/donut-base, suitable for document understanding tasks

Text Recognition

Convnext Tiny 224 Finetuned Eurosat Vitconfig Test 1

ConvNeXt-Tiny model fine-tuned on an image folder dataset, suitable for image classification tasks

Image Classification

Vit Base Patch16 224 In21k Finetuned Cifar10 Test

A fine-tuned test version of Google Vision Transformer (ViT) base model on CIFAR-10 dataset

Image Classification

Ast Finetuned Audioset 10 10 0.4593 Finetuning ESC 50 Slower LR

Audio classification model based on AST architecture, pre-trained on the AudioSet dataset and fine-tuned on the ESC-50 dataset

Audio Classification

Vit Base Patch16 224 Finetuned

An image classification model fine-tuned based on Google's Vision Transformer (ViT), trained on custom image datasets

Image Classification

Donut Base Sroie Fine Tuned

A fine-tuned version based on the naver-clova-ix/donut-base model on an image folder dataset, suitable for document understanding tasks.

Text Recognition

Model fine-tuned based on naver-clova-ix/donut-base for processing image data

Text Recognition

Donut Base Label Studio 200 Invoices

Invoice recognition model based on Donut architecture, fine-tuned on a dataset of 200 invoices

Text Recognition

Vit Base Patch16 224 Finetuned Imageclassification

Image classification model fine-tuned on image folder dataset based on Google's ViT model, achieving 95.02% accuracy

Image Classification

Deit Base Patch16 224 FV Finetuned Memes

A meme classification model fine-tuned from facebook/deit-base-patch16-224, achieving 84.85% accuracy on the imagefolder dataset

Image Classification

My Awesome Eli5 Mlm Model

Model fine-tuned based on distilroberta-base, specific purpose not clearly stated

Large Language Model

Bart Base Few Shot K 256 Finetuned Squad Seed 0

This model is a fine-tuned version of facebook/bart-base on the SQuAD dataset, suitable for question-answering tasks.

Question Answering System

Bart Base Few Shot K 64 Finetuned Squad Seed 2

A question-answering model fine-tuned on the SQuAD dataset based on facebook/bart-base

Question Answering System

Vit Base Patch16 384 Wi3

Fine-tuned model based on Google Vision Transformer (ViT) architecture, suitable for image classification tasks

Image Classification

Wav2vec2 Xls R 300m Mrbrown Finetune1

A speech recognition model fine-tuned using the uob_singlish dataset based on the facebook/wav2vec2-xls-r-300m pre-trained model

Speech Recognition

Malaya Speech Mrbrown Finetune1

This model is a fine-tuned version of wav2vec2-xls-r-300m-mixed based on the uob_singlish dataset, specializing in Singapore English speech recognition.

Speech Recognition

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase