Lucy-gguf開源模型 - 支持自主網絡搜索瀏覽，可在移動設備高效運行

首頁

Lucy Gguf

由Menlo開發

Lucy是一款專注於自主網絡搜索和輕量級瀏覽的17億參數模型，優化後可在移動設備上高效運行。

大型語言模型

Transformers

英語開源協議:Apache-2.0 #移動端搜索優化 #自主網絡搜索 #輕量級瀏覽

下載量 618

發布時間 : 7/18/2025

模型概述

基於Qwen3-1.7B構建的輕量級模型，專注於自主網絡搜索和瀏覽任務，特別優化適用於移動設備CPU環境。

模型特點

移動設備優化

經過特別優化，可在CPU或移動設備上高效運行

自主搜索能力

集成MCP工具支持強大的自主網絡搜索功能

輕量級瀏覽

提供基本的網頁瀏覽功能，支持通過Crawl4AI等工具實現

強化學習優化

通過純強化學習和機器生成的任務向量優化思維過程

模型能力

自主網絡搜索

網頁內容解析

信息檢索

移動端推理

使用案例

信息檢索

網絡搜索代理

作為自主網絡搜索代理，自動獲取網絡信息

在SimpleQA基準測試上準確率高於DeepSeek-v3

移動應用

移動端智能助手

在移動設備上提供智能搜索和瀏覽功能

可在CPU配置的移動設備上流暢運行

🚀 Lucy：使用17億參數模型在移動設備上實現前沿的自主網絡搜索

Lucy是一款專注於自主網絡搜索和輕量級瀏覽的17億參數模型。它基於[Qwen3 - 1.7B](https://huggingface.co/Qwen/Qwen3 - 1.7B)構建，在繼承大型模型深度研究能力的同時，經過優化可在移動設備上高效運行，即使僅使用CPU配置也沒問題。

[](https://github.com/menloresearch/deep - research) [](https://opensource.org/licenses/Apache - 2.0)

作者：Alan Dao，Bach Vu Dinh，Alex Nguyen，Norapat Buppodom

image/gif

🚀 快速開始

Lucy可通過多種方式進行部署，包括使用vLLM、llama.cpp，或通過本地應用程序（如Jan、LMStudio和其他兼容的推理引擎）。該模型支持通過MCP與搜索API和網頁瀏覽工具集成。

部署

使用VLLM進行部署：

vllm serve Menlo/Lucy-128k \
    --host 0.0.0.0 \
    --port 1234 \
    --enable-auto-tool-choice \
    --tool-call-parser hermes

或者使用llama.cpp中的llama-server：

llama-server ...

✨ 主要特性

🔍 強大的自主搜索能力：由支持MCP的工具（如集成谷歌搜索的Serper）提供支持。
🌐 基本的瀏覽功能：可通過Crawl4AI（MCP服務器即將發佈）、Serper等實現。
📱 針對移動設備優化：模型足夠輕量，可在CPU或移動設備上以不錯的速度運行。
🎯 專注的推理能力：通過機器生成的任務向量優化搜索任務的思維過程。

📚 詳細文檔

概述

Lucy是一款緊湊但功能強大的17億參數模型，專注於自主網絡搜索和輕量級瀏覽。它基於[Qwen3 - 1.7B](https://huggingface.co/Qwen/Qwen3 - 1.7B)構建，在繼承大型模型深度研究能力的同時，經過優化可在移動設備上高效運行，即使僅使用CPU配置也沒問題。

我們通過機器生成的任務向量優化思維過程、平滑多類別獎勵函數，並採用純強化學習（無任何監督微調）實現了這一目標。

評估

採用與[Jan - Nano](https://huggingface.co/Menlo/Jan - nano)和[Jan - Nano - 128k](https://huggingface.co/Menlo/Jan - nano - 128k)相同的MCP基準測試方法，儘管Lucy只是一個17億參數的模型，但它表現出色，在[SimpleQA](https://openai.com/index/introducing - simpleqa/)上的準確率高於DeepSeek - v3。

![image/png](https://cdn - uploads.huggingface.co/production/uploads/65713d70f56f9538679e5a56/lG2FqLCWXq1N8lh7wlJgW.png)