俄语优化

# 俄语优化

本项目使用mergekit和DARE TIES方法合并了soob3123/amoral-gemma3-12B-v2和IlyaGusev/saiga_gemma3_12b两个模型，旨在提供更强大的语言处理能力。

大型语言模型

基于Mistral 3.1架构升级的融合模型，保留俄语处理能力并增强对话表现

大型语言模型

Transformers 支持多种语言

Vikhr YandexGPT 5 Lite 8B It

基于YandexGPT-5-Lite-8B-pretrain的指令模型，通过俄语数据集GrandMaster-PRO-MAX和Grounded-RAG-RU-v2进行SFT训练，擅长俄语和英语任务。

大型语言模型

Transformers 支持多种语言

Ruadaptqwen2.5 7B Lite Beta

本项目是对T-lite-it-1.0模型进行俄语适配，通过更换分词器、在俄语语料库上继续预训练以及应用LEP技术，提升了俄语文本的生成速度。

大型语言模型

Ruadaptqwen2.5 32B Pro Beta

该项目是对模型进行俄语适配的成果，通过更换分词器、在俄语语料库上继续预训练以及应用LEP技术，提升了俄语文本的生成速度，为俄语自然语言处理提供了新的解决方案。

大型语言模型

基于Qwen2.5-1.5B-Instruct微调的俄语指令优化模型，15亿参数，支持俄英双语，擅长RAG流程中的文本问答

大型语言模型

Transformers 支持多种语言

Vikhr Llama 3.2 1B Instruct

基于Llama-3.2-1B-Instruct的俄语优化指令模型，效率提升5倍，适合低功耗设备部署

大型语言模型

基于mT5-base的多语言新闻摘要模型，支持45种语言的新闻标题和摘要生成

Transformers 支持多种语言

It 5.3 Fp16 32k

旋风0.5*是一个支持俄语和英语的开源大语言模型，扩展了RoPE上下文窗口至32k，优化了JSON处理和多轮对话能力

大型语言模型

Transformers 支持多种语言

Vikhr是基于Mistral架构的俄语模型，经过4亿标记的三轮预训练，在俄语任务上表现优于原版Mistral，但在代码处理方面可能存在不足。

大型语言模型

Transformers 支持多种语言

基于google/mt5-base的精简版本，专为俄语和英语优化，参数量减少58%

大型语言模型支持多种语言

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

大型语言模型

Transformers 支持多种语言

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Transformers 英语

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

问答系统中文

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase