Language Detection
MIT
基於BERT的多語言檢測模型,支持200種語言的文本分類任務
文本分類 支持多種語言
L
alexneakameni
1,210
1
M2 BERT 128 Retrieval Encoder V1
Apache-2.0
M2-BERT-128是論文《Benchmarking and Building Long-Context Retrieval Models with LoCo and M2-BERT》中提出的8000萬參數檢索模型檢查點
文本嵌入
Transformers 英語

M
hazyresearch
19
3
Layoutlm Wikipedia Ja
這是一個基於日語文本預訓練的LayoutLM模型,主要用於處理日語文檔的令牌分類任務。
大型語言模型
Transformers 日語

L
jri-advtechlab
22
1
Environmentalbert Biodiversity
Apache-2.0
基於EnvironmentalBERT-base微調的生物多樣性文本分類模型,專注於ESG/自然領域的生物多樣性文本檢測
大型語言模型
Transformers 英語

E
ESGBERT
101
5
M2 Bert 80M 32k Retrieval
Apache-2.0
這是一個80M參數的M2-BERT預訓練模型,支持長達32768的序列長度,專為長上下文檢索任務優化
文本嵌入
Transformers 英語

M
togethercomputer
1,274
129
Ghisbert
MIT
GHisBERT是基於BERT架構的模型,專為歷史德語數據從頭訓練而成,涵蓋德語所有有文獻記載的發展階段。
大型語言模型
Transformers

G
christinbeck
37
4
Bert Addresses
基於BERT架構的命名實體識別模型,專門用於標註人名、機構名及美國地址信息
序列標註
Transformers

B
ctrlbuzz
3,284
8
Luke Japanese Wordpiece Base
Apache-2.0
基於日語BERT改進的LUKE模型,專為日語命名實體識別任務優化
序列標註
Transformers 日語

L
uzabase
16
4
Econobert
Apache-2.0
EconoBert是基於bert-base-uncased在經濟學領域數據集上微調的模型,適用於經濟學、政治學和金融學領域的NLP任務。
大型語言模型
Transformers 英語

E
samchain
78
5
Geolm Base Toponym Recognition
GeoLM是一個用於從句子中檢測地名的語言模型,基於全球範圍的OpenStreetMap、WikiData和Wikipedia數據預訓練,並在GeoWebNews數據集上微調。
序列標註
Transformers 英語

G
zekun-li
186
6
Simcse Indobert Base
基於IndoBERT的SimCSE模型,用於生成印尼語句子的語義嵌入向量
文本嵌入
Transformers 其他

S
LazarusNLP
26
1
Indobertnews
MIT
基於indolem/indobert-base-uncased微調的印尼語文本分類模型,在評估集上準確率達79.54%
大型語言模型
Transformers

I
mrizalf7
42
1
Bert Base Han Chinese Pos Jindai
Gpl-3.0
提供針對古漢語的詞性標註功能,訓練數據集涵蓋漢語發展的四個歷史時期。
序列標註
Transformers 中文

B
ckiplab
28
1
Ruscibert
Apache-2.0
由Sber AI團隊與莫斯科國立大學人工智能研究所MLSA實驗室聯合訓練的俄語BERT模型,專注於科學文本處理
大型語言模型
Transformers 其他

R
ai-forever
1,044
7
Vietnamese Address Embedding
這是一個基於sentence-transformers的模型,能夠將越南語地址句子和段落映射到768維的密集向量空間,主要用於地址標準化任務。
文本嵌入
Transformers

V
CaoHaiNam
58
0
Nezha Cn Base
哪吒(NEZHA)是一個面向中文理解的神經語境化表徵模型,基於Transformer架構,由華為諾亞方舟實驗室開發。
大型語言模型
Transformers

N
sijunhe
1,443
12
Bert Ancient Chinese
Apache-2.0
這是一個基於BERT架構的中文預訓練語言模型,支持文言文和現代漢語處理。
大型語言模型
Transformers 中文

B
Jihuai
625
25
Sentece Embeddings BETO
基於sentence-transformers的西班牙語BERT模型,用於生成句子和段落的768維向量表示
文本嵌入
Transformers

S
espejelomar
75
1
Legal Hebert Ft
Legal-HeBERT 是一個面向希伯來語法律及立法領域的 BERT 模型,旨在推動希伯來語法律自然語言處理研究與工具開發。
大型語言模型
Transformers

L
avichr
48
3
Arabertmo Base V10
AraBERTMo是基於谷歌BERT架構的阿拉伯語預訓練語言模型,支持填充掩碼任務。
大型語言模型
Transformers

A
Ebtihal
39
0
Bert Base Italian Xxl Uncased Finetuned ComunaliRoma
MIT
該模型是基於意大利語預訓練模型bert-base-italian-xxl-uncased在特定數據集上微調的版本,適用於意大利語文本處理任務。
大型語言模型
Transformers

B
maxspaziani
23
0
Bert Base Chinese Ws
Gpl-3.0
提供繁體中文的transformers模型及自然語言處理工具
大型語言模型 中文
B
ckiplab
48.37k
16
Bert Base Ja
基於日語維基百科數據集訓練的BERT基礎模型,適用於日語文本的掩碼填充任務
大型語言模型
Transformers 日語

B
colorfulscoop
16
1
Muril Adapted Local
Apache-2.0
MuRIL是谷歌開源的基於17種印度語言及其轉寫版本預訓練的BERT模型,支持多語言表示。
大型語言模型 支持多種語言
M
monsoon-nlp
24
2
Roberta Base
基於韓語預訓練的RoBERTa模型,適用於多種韓語自然語言處理任務。
大型語言模型
Transformers 韓語

R
klue
1.2M
33
Alephbert Base
Apache-2.0
當前最先進的希伯來語語言模型,基於BERT架構
大型語言模型 其他
A
onlplab
25.26k
18
Klue Bert Base Aihub Mrc
基於KLUE BERT-base微調的韓語機器閱讀理解模型,使用AIHub數據集訓練
問答系統
Transformers 韓語

K
bespin-global
29
1
Rubert Base Cased Sentiment
基於RuBERT架構的俄語短文本情感分類模型,支持中性、積極和消極三種情感分類
文本分類 其他
R
blanchefort
51.45k
16
Bert Base Arabertv01
基於BERT架構的阿拉伯語預訓練語言模型,支持多種阿拉伯語NLP任務
大型語言模型 阿拉伯語
B
aubmindlab
293
2
Bert Medium Arabic
預訓練的阿拉伯語BERT中型語言模型,基於約82億詞的阿拉伯語文本資源訓練
大型語言模型 阿拉伯語
B
asafaya
66
0
Dehatebert Mono German
Apache-2.0
該模型基於多語言BERT微調,專門用於檢測德語中的仇恨言論,採用單語(英語)訓練數據。
文本分類 德語
D
Hate-speech-CNERG
300
3
Chinese Bigbird Base 4096
Apache-2.0
基於BigBird架構的中文預訓練模型,支持4096長度的上下文處理
大型語言模型
Transformers 中文

C
Lowin
48
3
Arabertmo Base V6
AraBERTMo是一個基於BERT架構的阿拉伯語預訓練語言模型,支持填充掩碼任務。
大型語言模型
Transformers 阿拉伯語

A
Ebtihal
14
0
Arabertmo Base V2
基於BERT架構的阿拉伯語預訓練語言模型,支持填充掩碼任務
大型語言模型
Transformers 阿拉伯語

A
Ebtihal
17
0
Arabertmo Base V4
AraBERTMo是一個基於BERT架構的阿拉伯語預訓練語言模型,支持填充掩碼任務。
大型語言模型
Transformers 阿拉伯語

A
Ebtihal
15
0
Sloberta
SloBERTa是一個專門針對斯洛文尼亞語優化的單語BERT類模型,基於Camembert架構開發。
大型語言模型
Transformers 其他

S
EMBEDDIA
2,691
5
Bert Base Arabic Camelbert Da Sentiment
Apache-2.0
基於CAMeLBERT方言阿拉伯語模型微調的情感分析模型,支持阿拉伯語文本情感分類
文本分類
Transformers 阿拉伯語

B
CAMeL-Lab
26.07k
44
Arabertmo Base V3
AraBERTMo是一個基於谷歌BERT架構的阿拉伯語預訓練語言模型,支持填充-掩碼任務。
大型語言模型
Transformers 阿拉伯語

A
Ebtihal
15
0
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98