TinyAgent-ToolRAGオープンソースモデル - エッジデバイスに適し、複雑な推論が可能でプライバシーを保護し低遅延

ホーム

Tinyagent ToolRAG

squeeze-ai-labによって開発

TinyAgentはエッジデバイス向けに設計された小型言語モデル(SLM)で、関数呼び出しと複雑な推論能力に特化し、プライバシー保護と低遅延サービスを提供します。

大規模言語モデル

Transformers

英語#エッジデバイス関数呼び出し #低遅延推論 #ツール検索拡張

ダウンロード数 45

リリース時間 : 5/27/2024

モデル概要

TinyAgentは高品質データとLLMCompilerを使用した関数呼び出しにより、小型言語モデルに複雑な推論能力を提供し、エッジデバイス展開に適しています。

モデル特徴

エッジデバイス最適化

エッジデバイス専用設計でリソース消費が低く、ローカルデバイスで動作可能

ToolRAG技術

ToolRAGを使用してクエリに最適なツールと例を検索し、精度を大幅に向上

プライバシー保護

ローカル展開によりデータ流出を防ぎ、より良いプライバシー保護を提供

低遅延

高速応答に最適化されており、リアルタイムインタラクションシーンに適している

モデル能力

関数呼び出し

タスク計画

テキスト生成

アプリケーション連携

使用事例

オフィス自動化

メール作成

ユーザーが電子メールを作成するのを支援

連絡先管理

ユーザーの連絡先情報を管理

カレンダー調整

カレンダーイベントを調整・管理

会議管理

Zoom会議組織

ユーザーがZoom会議を組織・調整するのを支援

🚀 TinyAgent: エッジでの関数呼び出し

TinyAgentは、エッジで安全かつプライベートにデプロイできる小型言語モデル（SLM）に、複雑な推論と関数呼び出し機能を実現することを目指しています。GPT - 4やGemini - 1.5などの従来の大規模言語モデル（LLM）は強力ですが、エッジデプロイには大きすぎてリソースを大量に消費し、プライバシー、接続性、レイテンシーの面で課題があります。TinyAgentは、高品質で精選されたデータで特殊なSLMを学習させ、LLMCompilerを用いた関数呼び出しに焦点を当てることで、これらの課題を解決します。代表的なアプリケーションとして、TinyAgentは様々なMacOSアプリケーションと対話し、メールの作成、連絡先の管理、カレンダーイベントのスケジューリング、Zoom会議の組織などの日常的なタスクをユーザーに支援します。

デスクトップアプリを入手‎ ‎ | ブログ記事を読む

Thumbnail

難しいタスクに直面したとき、SLMエージェントは適切なツールと文脈内の例が必要です。モデルが関係のない例を見ると、幻覚を起こすことがあります。同様に、モデルが必要のないツールの説明を見ると、混乱しやすく、これらのツールは不必要なプロンプトスペースを占有します。この問題を解決するために、TinyAgentはToolRAGを使って、与えられたクエリに適した最適なツールと例を取得します。このプロセスはレイテンシーが最小限で、TinyAgentの精度を大幅に向上させます。詳細については、ブログ記事をご覧ください。

✨ 主な機能

TinyAgentは、エッジでのデプロイに適した小型言語モデルに複雑な推論と関数呼び出し機能を提供します。
ToolRAGを使用して、与えられたクエリに最適なツールと例を取得し、精度を向上させます。
MacOSアプリケーションとの対話を通じて、ユーザーの日常的なタスクを支援します。

📦 インストール

TinyAgentモデルの使用方法の詳細については、Githubをご覧ください。TinyAgentモデルはプログラムで使用することも、ユーザーインターフェースを通じて使用することもできます。

💻 使用例

TinyAgentモデルの使用方法の詳細については、Githubを参照してください。

📚 ドキュメント

モデル開発者

カリフォルニア大学バークレー校のSqueeze AI Lab

バリエーション

TinyAgentモデルには2種類のサイズがあります：TinyAgent - 1.1BとTinyAgent - 7B

トレーニング詳細

データセット

私たちは、40,000の実生活でのユースケースを収集した[データセット](https://huggingface.co/datasets/squeeze - ai - lab/TinyAgent - dataset)を作成しました。GPT - 3.5 - Turboを使って現実世界の命令を生成し、これを使ってGPT - 4 - Turboで合成実行計画を取得します。データセットの詳細については、[ブログ記事](https://bair.berkeley.edu/blog/2024/05/29/tiny - agent/)をご覧ください。

ファインチューニング手順

TinyAgentモデルはベースモデルからファインチューニングされます。以下は、各TinyAgentモデルとそのベースモデルの表です。

モデル	成功率
GPT - 3.5 - turbo	65.04%
GPT - 4 - turbo	79.08%
[TinyLLama - 1.1B - 32K - Instruct](https://huggingface.co/Doctor - Shotgun/TinyLlama - 1.1B - 32k - Instruct)	12.71%
[WizardLM - 2 - 7b](https://huggingface.co/MaziyarPanahi/WizardLM - 2 - 7B - GGUF)	41.25%
TinyAgent - 1.1B + ToolRAG / [[hf](https://huggingface.co/squeeze - ai - lab/TinyAgent - 1.1B)] [[gguf](https://huggingface.co/squeeze - ai - lab/TinyAgent - 1.1B - GGUF)]	80.06%
TinyAgent - 7B + ToolRAG / [[hf](https://huggingface.co/squeeze - ai - lab/TinyAgent - 7B)] [[gguf](https://huggingface.co/squeeze - ai - lab/TinyAgent - 7B - GGUF)]	84.95%

上記の合成データ生成プロセスを使用して、LoRAを用いたパラメータ効率的なファインチューニングで、ベースモデルを3エポックでファインチューニングします。ファインチューニング手順の詳細については、[ブログ記事](https://bair.berkeley.edu/blog/2024/05/29/tiny - agent/)をご覧ください。