128K長文本

# 128K長文本

Llama 3.1 Nemotron Nano 4B V1.1

Llama-3.1-Nemotron-Nano-4B-v1.1 是一個基於Llama 3.1 8B壓縮而來的大型語言模型，優化了推理能力和任務執行效率，適用於單塊RTX顯卡本地運行。

大型語言模型

Transformers 英語

Typhoon2.1 Gemma3 4b

泰語大語言模型（指令調優版），擁有40億參數、128K上下文長度且具備函數調用能力

大型語言模型

Typhoon2.1 Gemma3 12b

Typhoon2.1-Gemma3-12B 是一個基於Gemma3架構的120億參數泰語大語言模型，支持128K上下文長度和函數調用功能。

大型語言模型

Phi 4 Mini Reasoning

Phi-4-mini-reasoning是一個輕量級的開源模型，專注於高質量、密集推理的數據，並進一步微調以獲得更高級的數學推理能力。

大型語言模型

Transformers 支持多種語言

R01 Gemma 3 1b It

Gemma 3是谷歌推出的輕量級開源多模態模型，基於與Gemini相同技術構建，支持文本和圖像輸入並生成文本輸出。

文本生成圖像

Transformers 英語

Phi 4 Mini Instruct Abliterated

Phi-4-mini-instruct是基於合成數據和精選公開網站構建的輕量級開源模型，專注於高質量、強推理能力的數據。支持128K令牌上下文長度，通過監督微調和直接偏好優化進行增強，以確保精準的指令遵循和安全性。

大型語言模型

Transformers 支持多種語言

Phi 4 Mini Instruct

Phi-4-mini-instruct是一個輕量級開源模型，基於合成數據和過濾後的公開網站數據構建，專注於高質量、富含推理能力的數據。支持128K令牌的上下文長度和多語言處理。

大型語言模型

Transformers 支持多種語言

Chocolatine 2 14B Instruct V2.0.3

Chocolatine-2-14B-Instruct-v2.0.3 是一個基於 Qwen-2.5-14B 架構的大語言模型，經過 DPO 微調，專注於法語和英語任務，在法語 LLM 排行榜中表現優異。

大型語言模型

Transformers 支持多種語言

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

大型語言模型

Transformers 支持多種語言

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Transformers 英語

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

問答系統中文

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase