Icedit Normal Lora
其他
這是一個基於LoRA技術的圖像到圖像轉換模型,主要用於非商業用途的圖像編輯任務。
圖像生成 英語
I
RiverZ
1,046
7
Ritrieve Zh V1 GGUF
MIT
本項目提供了對 richinfoai/ritrieve_zh_v1 模型的靜態量化版本,通過量化處理減少存儲空間和計算資源需求,同時保持一定性能。
大型語言模型
Transformers 中文

R
mradermacher
212
1
Chunkformer Large Vie
基於ChunkFormer架構的大規模越南語自動語音識別模型,在約3000小時的越南語公開語音數據上微調,性能優異。
語音識別 其他
C
khanhld
1,765
12
Bert Uncased Intent Classification
Apache-2.0
這是一個基於BERT的微調模型,用於將用戶輸入分類為82種不同的意圖,適用於對話系統和自然語言理解任務。
文本分類
Transformers 英語

B
yeniguno
1,942
1
Vitpose Plus Large
Apache-2.0
ViTPose++是基於視覺Transformer的人體姿態估計基礎模型,在MS COCO關鍵點測試集上達到81.1 AP的優異表現。
姿態估計
Transformers

V
usyd-community
1,731
1
TIPO 500M Ft
其他
TIPO是基於文本預採樣的提示優化文本轉圖像系統,通過大型語言模型優化用戶輸入提示,提升生成模型的質量與易用性。
文本生成圖像 英語
T
KBlueLeaf
10.92k
29
Vitpose Base Coco Aic Mpii
Apache-2.0
ViTPose是一個基於視覺Transformer的人體姿態估計模型,通過簡單的架構設計在MS COCO等基準上取得了優異表現。
姿態估計
Transformers 英語

V
usyd-community
38
1
Aura 4B GGUF
Apache-2.0
Aura-4B是一個基於AuraIndustries/Aura-4B的量化版本,使用llama.cpp進行imatrix量化,支持多種量化類型,適用於文本生成任務。
大型語言模型 英語
A
bartowski
290
8
Viwhisper Medium
MIT
針對越南語語音識別任務優化的Whisper-medium模型,在1308小時越南語數據上微調
語音識別
Transformers 其他

V
NhutP
139
4
Whisper Ja Anime V0.1
專注於日語動漫領域語音識別的Whisper變體模型,針對動漫音頻特點優化
語音識別 日語
W
efwkjn
205
15
F5 Hindi 24KHz
基於F5架構從頭開始訓練的印地語文本轉語音模型,由印度理工學院馬德拉斯分校SPRING實驗室開發。
語音合成 其他
F
SPRINGLab
1,430
18
Llama3 Aloe 8B Alpha GGUF
Llama3-Aloe-8B-Alpha 是一個專注於生物學和醫學領域的8B參數大語言模型,提供GGUF格式量化版本
大型語言模型
Transformers 英語

L
tensorblock
224
1
Kazrush Ru Kk
Apache-2.0
kazRush-ru-kk 是一個基於T5配置的俄語到哈薩克語的翻譯模型,在多個開源平行數據集上訓練而成。
機器翻譯
Transformers 其他

K
deepvk
332
8
Noobai Xl Nai Xl Epsilonpred10version Sdxl
其他
一個基於SDXL的動漫風格文本生成圖像模型,適合新手使用,能夠生成高質量的動漫角色和風格化圖像。
圖像生成 英語
N
John6666
87
3
Birefnet Matting
BiRefNet是一個基於雙邊參考的高分辨率二分圖像分割模型,專注於背景去除和掩膜生成任務。
圖像分割
B
ZhengPeng7
1,578
18
TIPO 500M
其他
TIPO是一個採用LLaMA架構的5億參數模型,專為文本轉圖像生成中的提示優化而設計。
文本生成圖像 英語
T
KBlueLeaf
2,013
51
Birefnet Lite 2K
高分辨率二分圖像分割的雙邊參考框架,專注於背景去除和掩膜生成任務
圖像分割
Safetensors
B
ZhengPeng7
3,400
8
Rad Dino Maira 2
其他
RAD-DINO-MAIRA-2 是一種基於DINOv2自監督學習訓練的視覺變換器模型,專門用於編碼胸部X光片圖像。

R
microsoft
9,414
11
Test Push
Apache-2.0
distilvit是一個基於VIT圖像編碼器和蒸餾版GPT-2文本解碼器的圖像轉文本模型,能夠生成圖像的文本描述。
圖像生成文本
Transformers

T
tarekziade
17
0
Octo Base 1.5
MIT
Octo 是一個用於機器人技術的多模態基礎模型,能夠通過視覺和語言輸入預測機器人動作。
多模態融合
Transformers

O
rail-berkeley
87
14
Rad Dino
其他
基於自監督學習DINOv2訓練的視覺Transformer模型,專門用於編碼胸部X光影像
圖像分類
Transformers

R
microsoft
411.96k
48
Pix2text Table Rec
MIT
基於微軟Table Transformer開發的表格結構識別模型,用於文檔中的表格檢測與識別任務
文字識別
Transformers

P
breezedeus
1,124
2
Japanese Reranker Cross Encoder Large V1
MIT
專為日語文本排序任務優化的交叉編碼器模型,具有24層和1024隱藏層大小的高性能架構
文本嵌入 日語
J
hotchpotch
2,959
15
Japanese Bge Reranker V2 M3 V1
MIT
這是一個日語Reranker(交叉編碼器)模型,用於文本排序任務,具有24層和1024隱藏層大小。
文本嵌入 日語
J
hotchpotch
1,151
15
Japanese Reranker Cross Encoder Small V1
MIT
這是一個日語訓練的Reranker(交叉編碼器)模型,用於文本排序任務。
文本嵌入 日語
J
hotchpotch
209
3
Japanese Reranker Cross Encoder Xsmall V1
MIT
這是一個日語訓練的Reranker(交叉編碼器)模型,用於文本排序任務。
文本嵌入 日語
J
hotchpotch
7,041
7
Whisper Tiny Vi
Apache-2.0
基於OpenAI Whisper-tiny架構微調的越南語自動語音識別(ASR)模型,在多個越南語數據集上表現出色
語音識別
Transformers 其他

W
doof-ferb
44
2
Finance LLM GGUF
其他
Finance LLM 是一個專注於金融領域的語言模型,基於 Llama 架構,經過 OpenOrca、Lima 和 WizardLM 等數據集的微調。
大型語言模型 英語
F
TheBloke
641
21
Deberta V3 Large Mnli Fever Anli Ling Wanli Binary
MIT
該模型是基於DeBERTa-v3-large架構的零樣本分類模型,主要在五個NLI數據集上訓練,適用於遵循原始NLI任務的任務。
文本分類
Transformers 英語

D
MoritzLaurer
30
0
Silver Retriever Base V1.1
銀色檢索器模型將波蘭語句子或段落編碼為768維稠密向量空間,可用於文檔檢索或語義搜索等任務。
文本嵌入
Transformers 其他

S
ipipan
862
9
Pairrm
MIT
PairRM是一個高效的成對獎勵模型,用於比較和排序大語言模型的輸出候選,支持多種應用場景如RLHF和最佳N採樣。
大型語言模型
Transformers 英語

P
llm-blender
6,004
198
Ag Nli DeTS Sentence Similarity V1
Apache-2.0
該模型使用SentenceTransformers的Cross-Encoder類進行訓練,用於預測兩個句子語義相似度的分數。
文本嵌入
Transformers 支持多種語言

A
abbasgolestani
982
0
Wav2vec2 Large Robust 24 Ft Age Gender
該模型以原始音頻信號作為輸入,輸出年齡預測值以及性別概率(兒童/女性/男性),同時輸出最後一層transformer的池化狀態。
音頻分類
Transformers

W
audeering
44.13k
33
Wav2vec2 Large Robust 6 Ft Age Gender
該模型通過微調Wav2Vec2-Large-Robust,能夠從原始音頻中預測說話者的年齡和性別。
音頻分類
Transformers

W
audeering
19.29k
2
Silver Retriever Base V1
Silver Retriever是一個針對波蘭語的神經檢索模型,專門用於句子相似度和段落檢索任務。
文本嵌入
Transformers 其他

S
ipipan
554
11
Gpt2 Bangla Summurizer
這是一個基於GPT2架構的孟加拉語文本摘要生成模型,專門針對新聞內容進行優化。
文本生成
Transformers 其他

G
faridulreza
18
0
All MiniLM L6 V2 Ct2 Int8
Apache-2.0
這是一個基於MiniLM架構的句子嵌入模型,能將文本映射到384維向量空間,適用於語義搜索和文本相似度任務。
文本嵌入 英語
A
jncraton
40
0
Vegam Whisper Medium Ml
MIT
這是將thennal/whisper-medium-ml轉換為CTranslate2模型格式的版本,用於馬拉雅拉姆語語音識別
語音識別 其他
V
smcproject
83
5
Whisper Small Japanese
Apache-2.0
該模型是基於openai/whisper-small微調的日語語音識別模型,支持日語語音轉文本任務。
語音識別
Transformers 日語

W
Ivydata
356
5
Whisper Base Japanese
Apache-2.0
本模型使用Common Voice、JVS和JSUT數據集對openai/whisper-base進行日語微調,適用於日語語音識別任務。
語音識別
Transformers 日語

W
Ivydata
137
3
- 1
- 2
- 3
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98