多數據集訓練

# 多數據集訓練

Icedit Normal Lora

這是一個基於LoRA技術的圖像到圖像轉換模型，主要用於非商業用途的圖像編輯任務。

圖像生成英語

Ritrieve Zh V1 GGUF

本項目提供了對 richinfoai/ritrieve_zh_v1 模型的靜態量化版本，通過量化處理減少存儲空間和計算資源需求，同時保持一定性能。

大型語言模型

Transformers 中文

Chunkformer Large Vie

基於ChunkFormer架構的大規模越南語自動語音識別模型，在約3000小時的越南語公開語音數據上微調，性能優異。

語音識別其他

Bert Uncased Intent Classification

這是一個基於BERT的微調模型，用於將用戶輸入分類為82種不同的意圖，適用於對話系統和自然語言理解任務。

Transformers 英語

Vitpose Plus Large

ViTPose++是基於視覺Transformer的人體姿態估計基礎模型，在MS COCO關鍵點測試集上達到81.1 AP的優異表現。

TIPO是基於文本預採樣的提示優化文本轉圖像系統，通過大型語言模型優化用戶輸入提示，提升生成模型的質量與易用性。

文本生成圖像英語

Vitpose Base Coco Aic Mpii

ViTPose是一個基於視覺Transformer的人體姿態估計模型，通過簡單的架構設計在MS COCO等基準上取得了優異表現。

Transformers 英語

Aura-4B是一個基於AuraIndustries/Aura-4B的量化版本，使用llama.cpp進行imatrix量化，支持多種量化類型，適用於文本生成任務。

大型語言模型英語

Viwhisper Medium

針對越南語語音識別任務優化的Whisper-medium模型，在1308小時越南語數據上微調

Transformers 其他

Whisper Ja Anime V0.1

專注於日語動漫領域語音識別的Whisper變體模型，針對動漫音頻特點優化

語音識別日語

基於F5架構從頭開始訓練的印地語文本轉語音模型，由印度理工學院馬德拉斯分校SPRING實驗室開發。

語音合成其他

Llama3 Aloe 8B Alpha GGUF

Llama3-Aloe-8B-Alpha 是一個專注於生物學和醫學領域的8B參數大語言模型，提供GGUF格式量化版本

大型語言模型

Transformers 英語

kazRush-ru-kk 是一個基於T5配置的俄語到哈薩克語的翻譯模型，在多個開源平行數據集上訓練而成。

Transformers 其他

Noobai Xl Nai Xl Epsilonpred10version Sdxl

一個基於SDXL的動漫風格文本生成圖像模型，適合新手使用，能夠生成高質量的動漫角色和風格化圖像。

圖像生成英語

Birefnet Matting

BiRefNet是一個基於雙邊參考的高分辨率二分圖像分割模型，專注於背景去除和掩膜生成任務。

TIPO是一個採用LLaMA架構的5億參數模型，專為文本轉圖像生成中的提示優化而設計。

文本生成圖像英語

Birefnet Lite 2K

高分辨率二分圖像分割的雙邊參考框架，專注於背景去除和掩膜生成任務

Rad Dino Maira 2

RAD-DINO-MAIRA-2 是一種基於DINOv2自監督學習訓練的視覺變換器模型，專門用於編碼胸部X光片圖像。

distilvit是一個基於VIT圖像編碼器和蒸餾版GPT-2文本解碼器的圖像轉文本模型，能夠生成圖像的文本描述。

圖像生成文本

Octo 是一個用於機器人技術的多模態基礎模型，能夠通過視覺和語言輸入預測機器人動作。

多模態融合

基於自監督學習DINOv2訓練的視覺Transformer模型，專門用於編碼胸部X光影像

Pix2text Table Rec

基於微軟Table Transformer開發的表格結構識別模型，用於文檔中的表格檢測與識別任務

Japanese Reranker Cross Encoder Large V1

專為日語文本排序任務優化的交叉編碼器模型，具有24層和1024隱藏層大小的高性能架構

文本嵌入日語

Japanese Bge Reranker V2 M3 V1

這是一個日語Reranker（交叉編碼器）模型，用於文本排序任務，具有24層和1024隱藏層大小。

文本嵌入日語

Japanese Reranker Cross Encoder Small V1

這是一個日語訓練的Reranker（交叉編碼器）模型，用於文本排序任務。

文本嵌入日語

Japanese Reranker Cross Encoder Xsmall V1

這是一個日語訓練的Reranker（交叉編碼器）模型，用於文本排序任務。

文本嵌入日語

Whisper Tiny Vi

基於OpenAI Whisper-tiny架構微調的越南語自動語音識別(ASR)模型，在多個越南語數據集上表現出色

Transformers 其他

Finance LLM GGUF

Finance LLM 是一個專注於金融領域的語言模型，基於 Llama 架構，經過 OpenOrca、Lima 和 WizardLM 等數據集的微調。

大型語言模型英語

Deberta V3 Large Mnli Fever Anli Ling Wanli Binary

該模型是基於DeBERTa-v3-large架構的零樣本分類模型，主要在五個NLI數據集上訓練，適用於遵循原始NLI任務的任務。

Transformers 英語

Silver Retriever Base V1.1

銀色檢索器模型將波蘭語句子或段落編碼為768維稠密向量空間，可用於文檔檢索或語義搜索等任務。

Transformers 其他

PairRM是一個高效的成對獎勵模型，用於比較和排序大語言模型的輸出候選，支持多種應用場景如RLHF和最佳N採樣。

大型語言模型

Transformers 英語

Ag Nli DeTS Sentence Similarity V1

該模型使用SentenceTransformers的Cross-Encoder類進行訓練，用於預測兩個句子語義相似度的分數。

Transformers 支持多種語言

Wav2vec2 Large Robust 24 Ft Age Gender

該模型以原始音頻信號作為輸入，輸出年齡預測值以及性別概率（兒童/女性/男性），同時輸出最後一層transformer的池化狀態。

Wav2vec2 Large Robust 6 Ft Age Gender

該模型通過微調Wav2Vec2-Large-Robust，能夠從原始音頻中預測說話者的年齡和性別。

Silver Retriever Base V1

Silver Retriever是一個針對波蘭語的神經檢索模型，專門用於句子相似度和段落檢索任務。

Transformers 其他

Gpt2 Bangla Summurizer

這是一個基於GPT2架構的孟加拉語文本摘要生成模型，專門針對新聞內容進行優化。

Transformers 其他

All MiniLM L6 V2 Ct2 Int8

這是一個基於MiniLM架構的句子嵌入模型，能將文本映射到384維向量空間，適用於語義搜索和文本相似度任務。

文本嵌入英語

Vegam Whisper Medium Ml

這是將thennal/whisper-medium-ml轉換為CTranslate2模型格式的版本，用於馬拉雅拉姆語語音識別

語音識別其他

Whisper Small Japanese

該模型是基於openai/whisper-small微調的日語語音識別模型，支持日語語音轉文本任務。

Transformers 日語

Whisper Base Japanese

本模型使用Common Voice、JVS和JSUT數據集對openai/whisper-base進行日語微調，適用於日語語音識別任務。

Transformers 日語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase