🚀 Home 3B v3
“Home”模型是對Stability AI的StableLM - 3B - Zephyr模型進行微調後的產物。該模型能夠控制用戶家中的設備,還能進行基本的問答。微調數據集是一個自定義整理的數據集,旨在教導模型進行函數調用。
模型的V3版本採用了新的基礎模型(StableLM),顯著提高了準確性。此外,還增加了:基本的多角色支持、基本的多語言支持,以及對更多Home Assistant實體類型(吸塵器、定時器和待辦事項)的支持。
注意:基礎模型本身並不具備多語言支持,但使用的分詞器在處理非英語語言方面比Phi - 2更好。我已經驗證,在一些隨機示例中,當請求是通過谷歌翻譯處理的英文請求時,該模型在德語、西班牙語和法語中確實可以正常工作。
為了能在像樹莓派這樣的低資源環境(這在Home Assistant安裝中很常見)中運行,該模型使用Lama.cpp進行了量化。
該模型可以使用Zephyr提示格式作為“指令”類型的模型。系統提示用於提供有關Home Assistant安裝狀態的信息,包括可用設備和可調用的服務。
示例“系統”提示
你是“Al”,一個能控制房屋內設備的智能助手。僅根據提供的信息按指示完成以下任務。
服務:light.turn_off()、light.turn_on(brightness,rgb_color)、fan.turn_on()、fan.turn_off()
設備:
light.office '辦公室燈光' = 開啟;亮度80%
fan.office '辦公室風扇' = 關閉
light.kitchen '廚房燈光' = 開啟;亮度80%;紅色
light.bedroom '臥室燈光' = 關閉
模型的輸出將包含一個應反饋給用戶的響應,以及一個可選的代碼塊,用於調用不同的Home Assistant“服務”。模型進行函數調用的輸出格式如下:
現在為你打開廚房的燈
```homeassistant
{ "service": "light.turn_on", "target_device": "light.kitchen" }
```
由於基礎模型進行了指令微調,該模型還能夠執行基本的指令和問答任務。例如,該模型能夠執行以下基本邏輯任務:
用戶:如果瑪麗7歲,而我比她大3歲,我多少歲?
助手:如果瑪麗7歲,那麼你10歲(7 + 3 = 10)。
🚀 快速開始
該模型可藉助Zephyr提示格式當作“指令”類型的模型來使用,通過系統提示提供Home Assistant安裝狀態的相關信息,進而實現設備控制與問答功能。
✨ 主要特性
- 基於StableLM - 3B - Zephyr模型微調,能控制家中設備並進行基本問答。
- V3版本採用新基礎模型,提升準確性,增加多角色、多語言及更多實體類型支持。
- 使用特定分詞器,對非英語語言處理能力優於Phi - 2。
- 經Lama.cpp量化,可在低資源環境運行。
- 支持基本指令和問答任務。
📦 安裝指南
文檔未提及安裝步驟,暫不提供。
💻 使用示例
基礎用法
你是“Al”,一個能控制房屋內設備的智能助手。僅根據提供的信息按指示完成以下任務。
服務:light.turn_off()、light.turn_on(brightness,rgb_color)、fan.turn_on()、fan.turn_off()
設備:
light.office '辦公室燈光' = 開啟;亮度80%
fan.office '辦公室風扇' = 關閉
light.kitchen '廚房燈光' = 開啟;亮度80%;紅色
light.bedroom '臥室燈光' = 關閉
高級用法
現在為你打開廚房的燈
```homeassistant
{ "service": "light.turn_on", "target_device": "light.kitchen" }
## 📚 詳細文檔
### 訓練
該模型在RTX 3090(24GB)上以LoRA形式進行訓練。LoRA的秩為64,alpha為128,目標模塊為`up_proj,down_proj,q_proj,v_proj,o_proj`。最後將完整模型合併在一起。
### 評估
該模型在測試數據集上的JSON函數調用準確率達到97.11%。
### 數據集
用於監督微調的合成數據集 - [https://huggingface.co/datasets/acon96/Home - Assistant - Requests](https://huggingface.co/datasets/acon96/Home-Assistant-Requests)
## 📄 許可證
此模型是對Stability AI StableLM模型系列的微調版本,該系列模型遵循STABILITY AI非商業研究社區許可協議。因此,此模型也在相同的非商業STABILITY AI非商業研究社區許可協議下發布。微調後的模型僅用於非商業用途。
### 信息表格
| 屬性 | 詳情 |
|------|------|
| 模型類型 | 對StableLM - 3B - Zephyr模型微調後的文本生成模型 |
| 訓練數據 | [自定義整理的數據集](https://github.com/acon96/home-llm)、[合成數據集](https://huggingface.co/datasets/acon96/Home-Assistant-Requests) |
| 訓練環境 | RTX 3090(24GB) |
| 評估指標 | 在測試數據集上JSON函數調用準確率達97.11% |
| 許可證 | STABILITY AI非商業研究社區許可協議,僅用於非商業用途 |