# 多源數據訓練

Kanjidnn
Apache-2.0
一個基於Keras框架構建的卷積神經網絡(CNN),專用於從64×64灰度圖像中識別單個日文字符,支持手寫體與印刷體識別。
文字識別 日語
K
gaiseras
38
0
Navaistt V1 Medium
Apache-2.0
基於Whisper medium模型微調的烏茲別克語語音識別模型,支持塔什干方言,訓練數據約700小時
語音識別 其他
N
islomov
3,081
12
Ko Reranker V1.1
Apache-2.0
基於Alibaba-NLP/gte-multilingual-reranker-base微調的韓語重排序模型,適用於搜索、問答等場景的文本相關性優化
文本嵌入 支持多種語言
K
sigridjineth
234
6
Kategoriopoiitis Ellinikon Poikilion
一個基於GreekBERT的文本分類器,用於將希臘語文本分類為四種變體:古代/中世紀希臘語、標準現代希臘語、通俗希臘語和純正希臘語。
文本分類 其他
K
glossAPI
13
2
Kazrush Kk Ru
Apache-2.0
kazRush-kk-ru 是一個基於T5配置的哈薩克語到俄語的翻譯模型,在多個平行數據集上訓練而成。
機器翻譯 Transformers 其他
K
deepvk
2,630
8
Skywork Critic Llama 3.1 8B
其他
天工評判系列模型是先進的評判模型,擅長進行成對偏好評估,能夠對輸入的一對內容進行比較和評估,給出細緻的判斷。
大型語言模型 PyTorch
S
Skywork
1,376
12
Aitextdetector
Openrail
基於GPT-2微調的文本分類模型,用於區分AI生成文本、知乎用戶回答文本和其他來源文本。
文本分類 中文
A
hugfaceguy0001
293
1
Real3d
MIT
Real3D是一個基於TripoSR架構的2D到3D映射Transformer模型,通過無監督自訓練和自動數據篩選擴展了真實世界圖像的處理能力。
3D視覺
R
hwjiang
22
19
Turkish Llama 8b V0.1
基於LLaMA-3 8B模型,使用30GB土耳其語數據集進行完整微調的土耳其語文本生成模型
大型語言模型 Transformers 其他
T
ytu-ce-cosmos
3,317
60
Music Large 800k
Apache-2.0
這是一個擁有7.8億參數的大型Transformer模型,專門用於音樂生成和轉錄任務,採用前瞻性訓練方法。
音頻生成 Transformers
M
stanford-crfm
73
27
Distill Whisper Th Medium
MIT
基於Whisper架構的蒸餾版自動語音識別模型,專為泰語優化,性能與效率兼備
語音識別 Transformers
D
biodatlab
303
2
Russian Text Normalizer
Apache-2.0
基於FRED-T5-large微調的俄語文本規範化模型,支持數字和拉丁字符的規範化處理
大型語言模型 Transformers 其他
R
saarus72
577
8
Bert Fda Nutrition Ner
MIT
這是一個專門為營養標籤領域的命名實體識別(NER)設計的BERT模型,用於檢測和分類不同的營養成分。
序列標註 Transformers 英語
B
sgarbi
64
14
Titulm Mpt 1b V1.0
Apache-2.0
TituLM-1B-BN-V1 是一個專為生成和理解孟加拉語文本而訓練的大型語言模型,基於包含45.1億孟加拉語標記的數據集進行了廣泛訓練。
大型語言模型 Transformers 其他
T
hishab
61
11
Hamsa V0.1 Beta
Apache-2.0
Hamsa是基於Whisper模型構建的阿拉伯語語音識別模型,專注於中東和北非地區的語言需求。
語音識別 Transformers 阿拉伯語
H
nadsoft
46
6
Suicidality
基於ELECTRA架構的文本分類模型,用於檢測文本中的自殺傾向表達
文本分類 Transformers 英語
S
sentinet
342
25
Lodestone Base 4096 V1
Apache-2.0
由Hum開發的sentence-transformers模型,支持4096 tokens長文本嵌入,適用於語義搜索和聚類任務
文本嵌入 英語
L
Hum-Works
132
11
Uniner 7B All
UniNER系列中的最優版本,融合了三大數據來源的命名實體識別模型
序列標註 Transformers 英語
U
Universal-NER
4,430
90
Trocr Base Printed Fr
MIT
基於Transformer的法語印刷體OCR模型,填補了TrOCR模型法語版本的空白
圖像生成文本 Transformers 法語
T
agomberto
110
2
Roberta Fact Check
MIT
基於Roberta架構的文本分類模型,用於根據證據判斷斷言的真偽。
文本分類 Transformers
R
Dzeniks
1,172
6
Deberta V1 Distill
Apache-2.0
針對俄語預訓練的雙向編碼器模型,通過標準掩碼語言建模目標在大規模文本語料上訓練完成
大型語言模型 Transformers 支持多種語言
D
deepvk
166
5
Google Safesearch Mini V2
Apache-2.0
超高精度的多類圖像分類器,可準確檢測敏感內容
圖像分類
G
FredZhang7
3,791
4
Dutch Sarcasm Detector
基於BERT架構的荷蘭語文本分類模型,用於檢測新聞標題中的諷刺內容
文本分類 Transformers 其他
D
helinivan
29
2
Japanese Gpt Neox Small
MIT
基於GPT-NeoX架構的小型日語語言模型,支持文本生成任務
大型語言模型 Transformers 支持多種語言
J
rinna
838
15
Wav2vec2 Large Chinese Zh Cn
Apache-2.0
基於XLSR-53大模型微調的中文語音識別模型,支持16kHz採樣率的語音輸入
語音識別 Transformers 中文
W
wbbbbb
585
40
Bert Base Swedish Cased Ner
瑞典國家圖書館/KBLab發佈的瑞典語BERT基礎模型,基於多源文本訓練
大型語言模型 其他
B
KB
20.77k
8
Bert Base Swedish Cased
瑞典國家圖書館/KBLab發佈的瑞典語BERT基礎模型,基於多源文本訓練
大型語言模型 其他
B
KB
11.16k
21
Deberta V3 Base Finetuned Finance Text Classification
MIT
基於microsoft/deberta-v3-base微調的金融文本情感分析模型,專門用於分析財經新聞和市場情緒
文本分類 Transformers
D
nickmuchi
1,540
21
Bert Base Bg
MIT
基於保加利亞語使用掩碼語言建模(MLM)目標預訓練的模型,區分大小寫。
大型語言模型 Transformers 其他
B
rmihaylov
561
8
Multi Qa V1 Distilbert Mean Cos
基於DistilBERT的句子嵌入模型,專為問答相似度任務優化,通過對比學習在多種問答數據集上微調
文本嵌入
M
flax-sentence-embeddings
2,156
0
Wav2vec2 Large Xlsr 53 Finnish
Apache-2.0
基於XLSR-53大模型微調的芬蘭語語音識別模型,支持16kHz音頻輸入
語音識別 其他
W
jonatasgrosman
73.11k
1
Alephbert Base
Apache-2.0
AlephBERT 是一個針對希伯來語的尖端語言模型,基於谷歌的BERT架構,專門為處理希伯來語文本設計。
大型語言模型 Transformers 其他
A
biu-nlp
26
0
Wav2vec2 Large 100k Voxpopuli Catala
Apache-2.0
基於facebook/wav2vec2-large-100k-voxpopuli模型微調的加泰羅尼亞語語音識別模型
語音識別 其他
W
ccoreilly
56
2
Wav2vec2 Large Xlsr Catala
Apache-2.0
基於facebook/wav2vec2-large-xlsr-53模型微調的加泰羅尼亞語自動語音識別模型
語音識別 其他
W
ccoreilly
31
1
Alephbert Base
Apache-2.0
當前最先進的希伯來語語言模型,基於BERT架構
大型語言模型 其他
A
onlplab
25.26k
18
Wav2vec2 Xls R 300m Cv6 Turkish
Apache-2.0
基於facebook/wav2vec2-xls-r-300m微調的土耳其語自動語音識別模型
語音識別 Transformers 其他
W
mpoyraz
38
7
Roberta Small Bulgarian
這是一個精簡版的保加利亞語RoBERTa模型,僅包含6個隱藏層,但保持了相近的性能表現。
大型語言模型 其他
R
iarfmoose
21
0
Gpt2 Finnish
Apache-2.0
基於GPT-2架構預訓練的芬蘭語語言模型,117M參數版本
大型語言模型 其他
G
Finnish-NLP
201
2
Bert Fa Zwnj Base Ner
針對波斯語命名實體識別(NER)任務微調的BERT模型,支持10類實體識別
序列標註 其他
B
HooshvareLab
6,189
3
Bert Tagalog Base Uncased
這是一個針對他加祿語(Tagalog)的預訓練語言模型,基於多源數據訓練而成,適用於自然語言處理任務。
大型語言模型 Transformers
B
GKLMIP
320
2
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase