低資源高效

# 低資源高效

Gemma 3n是谷歌推出的輕量級多模態模型，基於Transformer架構，支持文本、音頻和視覺（圖像和視頻）輸入，適用於低資源設備。

圖像生成文本

Phi 4 Reasoning Plus

Phi-4推理增強版是微軟研究院開發的140億參數開源推理模型，通過監督微調和強化學習優化，專注於數學、科學和編程領域的高級推理能力。

大型語言模型

Transformers 支持多種語言

Phi 4 Reasoning Plus GGUF

Phi-4-reasoning-plus 是由微軟研究院開發的開源推理模型，專注於數學、科學和編程領域的高級推理能力。

大型語言模型支持多種語言

T5 Small Finetuned Xsum

基於T5-small模型在XSum數據集上微調的文本摘要模型

Llama 3.1 8B SuperNova EtherealHermes GGUF

基於Llama-3.1架構的8B參數大語言模型，提供多種量化版本的GGUF格式文件

大型語言模型英語

Ket5 News Summarizer

基於T5架構的韓語文本摘要模型，專門針對新聞報道進行微調訓練

文本生成支持多種語言

Aya Vision 8B是一個開放權重的80億參數多語言視覺語言模型，支持23種語言的視覺和語言任務。

圖像生成文本

Transformers 支持多種語言

Qwen2.5 0.5B Portuguese V1

基於Qwen2.5-0.5B-Instruct微調的葡萄牙語大語言模型，專注於文本生成任務

大型語言模型其他

DRAMA-large (0.3B) 是一個基於剪枝後大語言模型架構構建的稠密檢索模型，針對高效且可泛化的多語言文本檢索任務進行優化。

Transformers 支持多種語言

Falcon3-10B-Instruct是Falcon3系列的開源基礎模型，擁有100億參數，專注於高質量指令跟隨任務，支持多語言處理，上下文長度可達32K tokens。

大型語言模型

Granite Embedding 30m English

IBM Granite Embedding 30M English 是一個基於 transformer 架構的英文文本嵌入模型，由 IBM 開發併發布。

Transformers 英語

Llama 3.1 Storm 8B GGUF

Llama-3.1-Storm-8B是基於Llama-3.1-8B-Instruct構建的改進模型，在多項基準測試中表現優異，適用於對話和函數調用任務。

大型語言模型支持多種語言

Mistral Nemo Instruct 2407 Awq

Mistral-Nemo-Instruct-2407 是一個基於 Mistral 架構的指令微調大語言模型，適用於多種自然語言處理任務。

大型語言模型

Serafim 100m Portuguese Pt Sentence Encoder

基於sentence-transformers的葡萄牙語句子編碼器，可將文本映射到768維向量空間，適用於語義搜索和聚類任務。

文本嵌入其他

採用3層Transformer架構的頂尖句子分割技術，支持多語言文本分割。

Transformers 支持多種語言

segment-any-text

OpenHermes 2.5 Mistral 7B 是基於 Mistral 架構微調的最先進模型，是 OpenHermes 2 的延續版本，在額外代碼數據集上進行了訓練。

大型語言模型

Ko Llama 3 8B Instruct

Ko-Llama-3-8B-Instruct 是一個專為提升韓語語言模型性能而開發的模型，基於 Meta-Llama-3-8B-Instruct 進行監督微調。

大型語言模型

Transformers 支持多種語言

Zion Alpha Instruction Tuned SLERP

Zion_Alpha_Instruction_Tuned_SLERP 是一款基於希伯來語訓練的創新型語言模型，在情感分析和自然語言推理等任務中表現卓越。

大型語言模型

Transformers 支持多種語言

SicariusSicariiStuff

Nllb 200 Distilled 600M En Zh CN

這是一個基於Meta公司NLLB-200-distilled-600M模型微調的機器翻譯模型，專門用於英語到簡體中文的翻譯任務。

Transformers 支持多種語言

Llama 3 Typhoon V1.5 8b Instruct

基於Llama3-8B架構開發的80億參數指令調優泰語大語言模型，支持泰語和英語。

大型語言模型

Transformers 支持多種語言

Llama 3 Wissenschaft 8B

基於Llama-3-8b構建的多語言混合模型，融合了德語、意大利語和英語能力

大型語言模型

Llama 3 8B Summarization QLoRa

基於Meta-Llama-3-8B模型在scitldr數據集上使用QLoRa技術微調的摘要生成模型

大型語言模型

Llama 3 8B Dutch

基於Llama 3 8B的荷蘭語對話模型，通過ORPO方法在荷蘭語反饋數據集上優化訓練

大型語言模型

Transformers 其他

Snowflake Arctic Embed Xs

Snowflake Arctic Embed XS 是一個輕量級的句子嵌入模型，專注於句子相似度和特徵提取任務。

Rakutenai 7B Instruct

RakutenAI-7B-instruct是基於Mistral-7B架構優化的日語和英語大語言模型，在日語理解基準測試中表現優異，同時保持英語能力競爭力。

大型語言模型

Transformers 支持多種語言

Bloomz 560m Reranking

基於Bloomz-560m構建的雙語重排序模型，用於衡量查詢與上下文的語義相關性，支持法語和英語

大型語言模型

Transformers 支持多種語言

Prodigy 7B GGUF Imatrix

Prodigy_7B的GGUF-Imatrix量化版本，採用重要性矩陣技術提升量化質量

大型語言模型

Qra是由波蘭國家信息處理研究所與格但斯克理工大學聯合開發的波蘭語優化大語言模型系列，基於TinyLlama-1.1B初始化並在900億波蘭語token上訓練

大型語言模型

Mobilellama 1.4B Chat

MobileLLaMA-1.4B-Chat 是基於 MobileLLaMA-1.4B-Base 微調而來的聊天模型，使用了 ShareGPT 數據集進行監督式指令微調。

大型語言模型

Mt5 Base Thaisum Text Summarization

基於mT5架構微調的泰語文本摘要模型，支持生成40-140字符的簡潔摘要

Transformers 其他

Btlm 3b 8k Chat

BTLM-3B-8k-chat是基於BTLM-3B-8K-base開發的對話版本，採用DPO方法優化，專為符合人類偏好的對話場景設計。

大型語言模型

Transformers 英語

Saiga Mistral 7b GPTQ

Saiga Mistral 7B是基於Mistral架構的俄語大語言模型，由Ilya Gusev開發。

大型語言模型

Openhermes 2.5 Mistral 7B GPTQ

OpenHermes 2.5是基於Mistral-7B微調的高級語言模型，專注於代碼生成和通用任務處理，性能優於前代版本。

大型語言模型

Transformers 英語

Openchat 3.5 GPTQ

OpenChat 3.5 7B是基於Mistral架構的7B參數大語言模型，由OpenChat團隊開發，採用Apache 2.0許可證發佈。

大型語言模型

Distilcamembert Lleqa

基於法語法律信息檢索數據集LLeQA訓練的句子嵌入模型，適用於法律文本的語義搜索和聚類任務

文本嵌入法語

maastrichtlawtech

Tst Summarization

基於google/pegasus-xsum微調的新聞摘要生成模型，在cnn_dailymail數據集上訓練

Transformers 英語

Scandi Nli Base

基於NbAiLab/nb-bert-base微調的自然語言推理模型，支持丹麥語、挪威博克馬爾語和瑞典語

Transformers 其他

T5 Small Finetuned Cnn V2

基於T5-small模型在cnn_dailymail數據集上微調的文本摘要生成模型

T5 Small Finetuned Cnn

基於T5-small架構在cnn_dailymail數據集上微調的文本摘要生成模型，擅長新聞摘要生成任務

T5 Finetuned Test

基於維基指南數據集訓練的T5-small架構文本摘要模型

文本生成英語

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase