# TPU高效訓練

Gemma 2 9b
Gemma是Google推出的輕量級前沿開放模型系列,基於與Gemini相同技術構建,適用於多種文本生成任務。
大型語言模型 Transformers
G
google
45.11k
655
Llama 3 Open Ko 8B Instruct Preview
其他
基於Llama-3-8B繼續預訓練的韓語語言模型,使用公開可用的60GB+去重文本訓練,支持韓語和英語。
大型語言模型 Transformers 支持多種語言
L
beomi
6,014
60
Gemma 2b
Gemma是谷歌推出的輕量級開源大語言模型,基於與Gemini相同技術構建,適用於多種文本生成任務。
大型語言模型 Transformers
G
alpindale
135
8
Gemma 7b
Gemma是Google推出的輕量級開源大語言模型,基於與Gemini相同技術構建,適用於多種文本生成任務。
大型語言模型
G
google
55.61k
3,160
Controlnet Segment Anything
Openrail
基於Stable Diffusion v1.5訓練的ControlNet模型,通過分割圖實現精確圖像生成控制
圖像生成 英語
C
mfidabel
33
28
Byt5 Small Historic English Span20
MIT
歷史多語言與單語言ByT5基礎模型,當前支持英語(大英圖書館語料庫 - 書籍)。
大型語言模型 英語
B
hmbyt5
18
1
Reddit Single Context Mpnet Base
基於MPNet-base預訓練模型,通過對比學習在7億Reddit對話句對上微調的句子嵌入模型
文本嵌入 英語
R
flax-sentence-embeddings
325
4
Biom ALBERT Xxlarge PMC
基於BERT、ALBERT和ELECTRA構建的大型生物醫學語言模型,在多項生物醫學任務中取得最先進成果
大型語言模型 Transformers
B
sultan
189
4
Biom ALBERT Xxlarge
基於BERT、ALBERT和ELECTRA構建的大型生物醫學語言模型,專注於生物醫學領域任務
大型語言模型 Transformers
B
sultan
77
2
Roberta Swedish
這是一個基於RoBERTa架構的瑞典語預訓練模型,適用於多種自然語言處理任務。
大型語言模型
R
birgermoell
54
0
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase