# 俄语优化

MT Gemma 3 12B
本项目使用mergekit和DARE TIES方法合并了soob3123/amoral-gemma3-12B-v2和IlyaGusev/saiga_gemma3_12b两个模型,旨在提供更强大的语言处理能力。
大型语言模型 Transformers
M
zelk12
1,348
2
Core 24B V.1
基于Mistral 3.1架构升级的融合模型,保留俄语处理能力并增强对话表现
大型语言模型 Transformers 支持多种语言
C
OddTheGreat
31
6
Vikhr YandexGPT 5 Lite 8B It
其他
基于YandexGPT-5-Lite-8B-pretrain的指令模型,通过俄语数据集GrandMaster-PRO-MAX和Grounded-RAG-RU-v2进行SFT训练,擅长俄语和英语任务。
大型语言模型 Transformers 支持多种语言
V
Vikhrmodels
3,058
20
Ruadaptqwen2.5 7B Lite Beta
Apache-2.0
本项目是对T-lite-it-1.0模型进行俄语适配,通过更换分词器、在俄语语料库上继续预训练以及应用LEP技术,提升了俄语文本的生成速度。
大型语言模型 Safetensors
R
RefalMachine
1,603
8
Ruadaptqwen2.5 32B Pro Beta
Apache-2.0
该项目是对模型进行俄语适配的成果,通过更换分词器、在俄语语料库上继续预训练以及应用LEP技术,提升了俄语文本的生成速度,为俄语自然语言处理提供了新的解决方案。
大型语言模型 Safetensors
R
RefalMachine
2,913
10
Meno Tiny 0.1
Apache-2.0
基于Qwen2.5-1.5B-Instruct微调的俄语指令优化模型,15亿参数,支持俄英双语,擅长RAG流程中的文本问答
大型语言模型 Transformers 支持多种语言
M
bond005
764
10
Vikhr Llama 3.2 1B Instruct
基于Llama-3.2-1B-Instruct的俄语优化指令模型,效率提升5倍,适合低功耗设备部署
大型语言模型 Transformers
V
Vikhrmodels
2,915
41
Any News Sum
基于mT5-base的多语言新闻摘要模型,支持45种语言的新闻标题和摘要生成
文本生成 Transformers 支持多种语言
A
data-silence
20
1
It 5.3 Fp16 32k
Apache-2.0
旋风0.5*是一个支持俄语和英语的开源大语言模型,扩展了RoPE上下文窗口至32k,优化了JSON处理和多轮对话能力
大型语言模型 Transformers 支持多种语言
I
Vikhrmodels
74
11
Vikhr 7b 0.1
Apache-2.0
Vikhr是基于Mistral架构的俄语模型,经过4亿标记的三轮预训练,在俄语任务上表现优于原版Mistral,但在代码处理方面可能存在不足。
大型语言模型 Transformers 支持多种语言
V
Vikhrmodels
259
57
Rut5 Base
MIT
基于google/mt5-base的精简版本,专为俄语和英语优化,参数量减少58%
大型语言模型 支持多种语言
R
cointegrated
27.85k
11
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase