🚀 OpenHands LM v0.1
OpenHands LM v0.1は、ソフトウェア開発における自律エージェントのためのオープンコーディングモデルです。このモデルは、オープンであり、ローカルでの実行が可能で、ソフトウェアエンジニアリングタスクで強力なパフォーマンスを発揮します。
🚀 クイックスタート
ソフトウェア開発の自律エージェントは、既に幅広いソフトウェア開発タスクに貢献しています。しかし、これまで強力なコーディングエージェントは、プロプライエタリモデルに依存していました。つまり、OpenHandsのようなオープンソースエージェントを使用しても、依然として外部サービスへのAPI呼び出しに依存することになります。
今日、私たちはOpenHands LMを紹介することを嬉しく思います。これは新しいオープンコーディングモデルで、以下の特徴を持っています。
- オープンであり、Hugging Faceで利用可能なため、ダウンロードしてローカルで実行できます。
- 適切なサイズ(32B)であるため、単一の3090 GPUなどのハードウェアでローカルで実行できます。
- ソフトウェアエンジニアリングタスクで強力なパフォーマンスを発揮し、SWE - Bench Verifiedで37.2%の解決率を達成します。
詳細と将来の計画については、以下をご覧ください!
✨ 主な機能
ベースモデルの活用
OpenHands LMは、Qwen Coder 2.5 Instruct 32Bをベースに構築されており、コーディングタスクに対する強力な基本機能を活用しています。
特殊なファインチューニング
- OpenHands自身が生成した多様なオープンソースリポジトリのトレーニングデータを使用しています。
- 具体的には、SWE - Gymで概説されているRLベースのフレームワークを使用して、トレーニング環境を設定し、既存のエージェントを使用してトレーニングデータを生成し、成功して解決された例でモデルをファインチューニングしています。
大きなトークンコンテキストウィンドウ
128Kトークンのコンテキストウィンドウを備えており、大規模なコードベースや長期的なソフトウェアエンジニアリングタスクを処理するのに最適です。
📦 インストール
OpenHands LMをすぐに使用するには、以下の方法があります。
- Hugging Faceからモデルをダウンロードする
モデルはHugging Faceで利用可能で、そこから直接ダウンロードできます。
- モデルサービングフレームワークでOpenAI互換エンドポイントを作成する
最適なパフォーマンスを得るために、SGLangまたはvLLMを使用してGPUでこのモデルをサービングすることをお勧めします。
- OpenHandsエージェントを新しいモデルに向ける
OpenHandsをダウンロードし、OpenAI互換エンドポイントの使用方法の指示に従ってください。
📚 ドキュメント
パフォーマンス
私たちは、最新の反復評価プロトコルを使用して、SWE - Bench VerifiedベンチマークでOpenHands LMを評価しました。結果は印象的です。
- SWE - Bench Verifiedで37.2%の検証済み解決率を達成しました。
- パラメータが20倍多いモデル(671BパラメータのDeepseek V3 0324(38.8%)を含む)と同等のパフォーマンスを発揮します。
以下は、OpenHands LMと他の主要なオープンソースモデルとの比較です。

このプロットが示すように、私たちの32Bパラメータのモデルは、はるかに大きなモデルに近い効率を達成しています。最大のモデル(671Bパラメータ)はわずかに高いスコアを達成しますが、私たちの32Bパラメータのモデルは非常に良好なパフォーマンスを発揮し、大きなモデルでは不可能なローカルデプロイの可能性を開拓しています。
今後の開発計画
この最初のリリースは、私たちの旅の始まりに過ぎません。私たちは、コミュニティのフィードバックと継続的な研究イニシアチブに基づいて、OpenHands LMを継続的に強化します。
特に、このモデルはまだ研究プレビュー段階であり、(1)GitHubの問題解決に関するタスクに最適で、より多様なソフトウェアエンジニアリングタスクでは性能が劣る可能性があり、(2)時々繰り返しステップを生成することがあり、(3)量子化にやや敏感で、低い量子化レベルでは完全なパフォーマンスを発揮できない可能性があります。次のリリースでは、これらの制限に対処することに焦点を当てます。
また、限られた計算リソースを持つユーザーをサポートするために、よりコンパクトなバージョンのモデル(7Bパラメータのバリアントを含む)を開発しています。これらの小さなモデルは、OpenHands LMの核心的な強みを維持しながら、ハードウェア要件を大幅に削減します。
私たちは、皆さんにOpenHands LMを試してみて、経験を共有し、その進化に参加していただくことをお勧めします。一緒に、明日のソフトウェア開発のためのより良いツールを作り上げましょう。
コミュニティへの参加
私たちは、皆さんにOpenHands LMの旅に参加していただくことをお待ちしています。
皆さんの経験とフィードバックを提供することで、このオープンソースイニシアチブの未来を形作る手助けになります。一緒に、明日のソフトウェア開発のためのより良いツールを作り上げましょう。
皆さんがOpenHands LMで何を作り出すか、楽しみにしています!
📄 ライセンス
このプロジェクトはMITライセンスの下でライセンスされています。
その他の情報
- AWQ量子化:stelterlabによって、casper - hansenのAutoAWQ(https://github.com/casper-hansen/AutoAWQ/)を使用してINT4 GEMMで行われました。
- オリジナルの重みはMistral AIによるものです。オリジナルのモデルカードは以下の通りです。
OpenHands LM v0.1
Blog
•
Use it in OpenHands
属性 |
详情 |
モデルタイプ |
オープンコーディングモデル |
トレーニングデータ |
OpenHands自身が生成した多様なオープンソースリポジトリのデータ |