Bart Large Teaser De V2
基於BART架構的大型德語文本處理模型,適用於多種自然語言處理任務
大型語言模型
Transformers

B
bettertextapp
123
0
3b De Ft Research Release Q4 K M GGUF
Apache-2.0
這是一個基於canopylabs/3b-de-ft-research_release模型轉換而來的GGUF格式模型,專門優化用於德語文本處理。
大型語言模型 德語
3
TheVisitorX
16
0
3b De Ft Research Release Q4 K M GGUF
Apache-2.0
這是一個基於canopylabs/3b-de-ft-research_release模型轉換的GGUF格式德語語言模型,適用於文本生成任務。
大型語言模型 德語
3
freddyaboulton
200
0
Llammlein 7B
其他
LLäMmlein 7B 是一個德語的 70 億參數 LLaMA 語言模型,基於調整後的 Tinyllama 代碼庫,在 RedPajama V2 的德語部分數據上從頭訓練而成。
大型語言模型
Transformers 德語

L
LSX-UniWue
251
2
Llama 3.1 SauerkrautLM 70b Instruct AWQ
Apache-2.0
Wisperlama是由DFG資助的Wispermed小組博士生團隊開發的文本生成模型,基於Llama-3.1架構優化。
大型語言模型
Safetensors 支持多種語言
L
WisPerMed
136
5
Llammlein 1B
其他
這是一個基於Tinyllama代碼框架、使用RedPajama V2德語語料從頭訓練的德語Tinyllama 1B語言模型。
大型語言模型
Transformers 德語

L
LSX-UniWue
304
14
Kafkalm 13B German V0.1
基於Llama2架構的德語語言模型,專注於德語文本生成任務
大型語言模型
Transformers 德語

K
seedboxai
16
6
T5 Efficient Gc4 All German Small El32
MIT
基於德語大規模清洗版Common Crawl語料庫(GC4)訓練的T5模型,專注於德語自然語言處理任務。
大型語言模型
Transformers 德語

T
GermanT5
52
4
Bloom 350m German
MIT
基於德語數據從頭訓練的BLOOM-350m語言模型,是BLOOM系列的小規模版本,專注於德語文本生成任務。
大型語言模型
Transformers 德語

B
malteos
26
0
Gpt2 Wechsel German
MIT
該模型採用WECHSEL方法訓練,通過子詞嵌入的有效初始化實現單語語言模型的跨語言遷移,特別針對德語優化。
大型語言模型
Transformers 德語

G
benjamin
36
4
Gerpt2
MIT
GerPT2是基於GPT2架構的德語大語言模型,在CC-100和德語維基百科數據集上訓練,性能優於同類德語GPT2模型。
大型語言模型 德語
G
benjamin
48
5
Gpt2 Model De
這是一個基於GPT-2架構的德語語言模型,專門針對德語文本生成任務進行了訓練。
大型語言模型
Transformers 德語

G
Tanhim
18
3
Gerpt2 Large
MIT
GerPT2是德語版GPT2的大規模版本,基於CC-100語料庫和德語維基百科訓練,在德語文本生成任務上表現優異。
大型語言模型 德語
G
benjamin
75
9
German Gpt2
MIT
這是一個基於GPT-2架構的德語語言模型,專門針對德語文本生成任務進行了優化。
大型語言模型 德語
G
anonymous-german-nlp
176
1
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98