# BPE分詞

Birna Bert
基於BERT架構的Transformer編碼器模型,專為生成RNA序列嵌入而設計
文本嵌入 Transformers
B
buetnlpbio
364
1
Gena Lm Bert Large T2t
GENA-LM 是一個面向長DNA序列的開源基礎模型家族,基於人類DNA序列訓練的Transformer掩碼語言模型。
分子模型 Transformers 其他
G
AIRI-Institute
386
7
Deberta V1 Distill
Apache-2.0
針對俄語預訓練的雙向編碼器模型,通過標準掩碼語言建模目標在大規模文本語料上訓練完成
大型語言模型 Transformers 支持多種語言
D
deepvk
166
5
Dialogpt Medium Spanish Chitchat
這是一個基於Transformer解碼器的GPT-2模型,專為西班牙語單輪對話任務而調整,具有3.45億參數。
對話系統 Transformers 西班牙語
D
ITG
1,890
4
Roberta Small Greek
這是一個基於RoBERTa架構的小型希臘語語言模型,參數規模約為基礎模型的一半,適用於希臘語文本的填充掩碼任務。
大型語言模型 Transformers 其他
R
ClassCat
22
2
Roberta TR Medium Bpe 44k
基於土耳其語的RoBERTa模型,採用掩碼語言建模(MLM)目標進行預訓練,不區分大小寫。
大型語言模型 Transformers 其他
R
ctoraman
48
0
Roberta TR Medium Bpe 16k
基於土耳其語使用掩碼語言建模(MLM)目標預訓練的RoBERTa模型,不區分大小寫,中等規模架構。
大型語言模型 Transformers 其他
R
ctoraman
26
0
Rubert Large
由SberDevices團隊預訓練的俄語大型語言模型,基於Transformer架構,參數量4.27億,訓練數據量30GB
大型語言模型 Transformers 其他
R
ai-forever
6,125
14
Kamo Naoyuki Mini An4 Asr Train Raw Bpe Valid.acc.best
這是一個基於ESPnet2框架訓練的自動語音識別(ASR)預訓練模型,使用mini-an4數據集訓練,支持英文語音識別。
語音識別 英語
K
espnet
425
1
Rubert Base
Apache-2.0
由SberDevices團隊預訓練的俄語基礎版BERT模型,參數量1.78億,基於30GB俄語文本訓練
大型語言模型 Transformers 其他
R
ai-forever
29.43k
33
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase