MT Gemma 3 12B
本项目使用mergekit和DARE TIES方法合并了soob3123/amoral-gemma3-12B-v2和IlyaGusev/saiga_gemma3_12b两个模型,旨在提供更强大的语言处理能力。
大型语言模型
Transformers

M
zelk12
1,348
2
Core 24B V.1
基于Mistral 3.1架构升级的融合模型,保留俄语处理能力并增强对话表现
大型语言模型
Transformers 支持多种语言

C
OddTheGreat
31
6
Vikhr YandexGPT 5 Lite 8B It
其他
基于YandexGPT-5-Lite-8B-pretrain的指令模型,通过俄语数据集GrandMaster-PRO-MAX和Grounded-RAG-RU-v2进行SFT训练,擅长俄语和英语任务。
大型语言模型
Transformers 支持多种语言

V
Vikhrmodels
3,058
20
Ruadaptqwen2.5 7B Lite Beta
Apache-2.0
本项目是对T-lite-it-1.0模型进行俄语适配,通过更换分词器、在俄语语料库上继续预训练以及应用LEP技术,提升了俄语文本的生成速度。
大型语言模型
Safetensors
R
RefalMachine
1,603
8
Ruadaptqwen2.5 32B Pro Beta
Apache-2.0
该项目是对模型进行俄语适配的成果,通过更换分词器、在俄语语料库上继续预训练以及应用LEP技术,提升了俄语文本的生成速度,为俄语自然语言处理提供了新的解决方案。
大型语言模型
Safetensors
R
RefalMachine
2,913
10
Meno Tiny 0.1
Apache-2.0
基于Qwen2.5-1.5B-Instruct微调的俄语指令优化模型,15亿参数,支持俄英双语,擅长RAG流程中的文本问答
大型语言模型
Transformers 支持多种语言

M
bond005
764
10
Vikhr Llama 3.2 1B Instruct
基于Llama-3.2-1B-Instruct的俄语优化指令模型,效率提升5倍,适合低功耗设备部署
大型语言模型
Transformers

V
Vikhrmodels
2,915
41
Any News Sum
基于mT5-base的多语言新闻摘要模型,支持45种语言的新闻标题和摘要生成
文本生成
Transformers 支持多种语言

A
data-silence
20
1
It 5.3 Fp16 32k
Apache-2.0
旋风0.5*是一个支持俄语和英语的开源大语言模型,扩展了RoPE上下文窗口至32k,优化了JSON处理和多轮对话能力
大型语言模型
Transformers 支持多种语言

I
Vikhrmodels
74
11
Vikhr 7b 0.1
Apache-2.0
Vikhr是基于Mistral架构的俄语模型,经过4亿标记的三轮预训练,在俄语任务上表现优于原版Mistral,但在代码处理方面可能存在不足。
大型语言模型
Transformers 支持多种语言

V
Vikhrmodels
259
57
Rut5 Base
MIT
基于google/mt5-base的精简版本,专为俄语和英语优化,参数量减少58%
大型语言模型 支持多种语言
R
cointegrated
27.85k
11
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98