Home

Openhands Lm 32b V0.1 AWQ

Developed by stelterlab

OpenHands LMは32Bパラメータのオープンソースプログラミングモデルで、ソフトウェア開発エージェント向けに設計されており、ローカル展開をサポートし、ソフトウェアエンジニアリングタスクで優れたパフォーマンスを発揮します。

大規模言語モデル

Safetensors

EnglishOpen Source License:MIT #プログラミングエージェント #32B軽量級 #コードタスク最適化

Downloads 2,635

Release Time : 4/2/2025

Model Overview

OpenHands LMは完全にオープンソースの大規模言語モデルで、プログラミングとソフトウェア開発タスクに特化しています。128Kトークンのコンテキストウィンドウをサポートし、大規模なコードベースの処理に適しており、SWE-Benchベンチマークテストで優れた結果を示しています。

Model Features

オープンソースでローカル展開可能

完全にオープンソースで、外部APIサービスに依存せずにローカルで実行可能

適度なパラメータ規模

32Bパラメータは適度な規模で、単一の3090グラフィックカードなどのコンシューマー向けハードウェアで動作可能

優れたプログラミング性能

SWE-Bench Verifiedテストセットで37.2%の解決率を達成し、より大規模なモデルに匹敵する性能

長文コンテキストサポート

128Kトークンのコンテキストウィンドウをサポートし、大規模なコードベースの処理に適している

Model Capabilities

コード生成

プログラミング問題解決

ソフトウェア開発タスク自動化

GitHub問題分析

Use Cases

ソフトウェア開発

GitHub問題解決

開発者がGitHub上のプログラミング問題を分析・解決するのを支援

SWE-Benchテストで37.2%の解決率を達成

コードベースメンテナンス

大規模なコードベースのメンテナンスを支援し、複雑なコード変更を処理

🚀 OpenHands LM v0.1

OpenHands LM v0.1は、ソフトウェア開発における自律エージェントのためのオープンコーディングモデルです。このモデルは、オープンであり、ローカルでの実行が可能で、ソフトウェアエンジニアリングタスクで強力なパフォーマンスを発揮します。

🚀 クイックスタート

ソフトウェア開発の自律エージェントは、既に幅広いソフトウェア開発タスクに貢献しています。しかし、これまで強力なコーディングエージェントは、プロプライエタリモデルに依存していました。つまり、OpenHandsのようなオープンソースエージェントを使用しても、依然として外部サービスへのAPI呼び出しに依存することになります。

今日、私たちはOpenHands LMを紹介することを嬉しく思います。これは新しいオープンコーディングモデルで、以下の特徴を持っています。

オープンであり、Hugging Faceで利用可能なため、ダウンロードしてローカルで実行できます。
適切なサイズ（32B）であるため、単一の3090 GPUなどのハードウェアでローカルで実行できます。
ソフトウェアエンジニアリングタスクで強力なパフォーマンスを発揮し、SWE - Bench Verifiedで37.2％の解決率を達成します。

詳細と将来の計画については、以下をご覧ください！

✨ 主な機能

ベースモデルの活用

OpenHands LMは、Qwen Coder 2.5 Instruct 32Bをベースに構築されており、コーディングタスクに対する強力な基本機能を活用しています。

特殊なファインチューニング

OpenHands自身が生成した多様なオープンソースリポジトリのトレーニングデータを使用しています。
具体的には、SWE - Gymで概説されているRLベースのフレームワークを使用して、トレーニング環境を設定し、既存のエージェントを使用してトレーニングデータを生成し、成功して解決された例でモデルをファインチューニングしています。

大きなトークンコンテキストウィンドウ

128Kトークンのコンテキストウィンドウを備えており、大規模なコードベースや長期的なソフトウェアエンジニアリングタスクを処理するのに最適です。

📦 インストール

OpenHands LMをすぐに使用するには、以下の方法があります。

Hugging Faceからモデルをダウンロードする モデルはHugging Faceで利用可能で、そこから直接ダウンロードできます。
モデルサービングフレームワークでOpenAI互換エンドポイントを作成する 最適なパフォーマンスを得るために、SGLangまたはvLLMを使用してGPUでこのモデルをサービングすることをお勧めします。
OpenHandsエージェントを新しいモデルに向ける OpenHandsをダウンロードし、OpenAI互換エンドポイントの使用方法の指示に従ってください。

📚 ドキュメント

パフォーマンス

私たちは、最新の反復評価プロトコルを使用して、SWE - Bench VerifiedベンチマークでOpenHands LMを評価しました。結果は印象的です。

SWE - Bench Verifiedで37.2％の検証済み解決率を達成しました。
パラメータが20倍多いモデル（671BパラメータのDeepseek V3 0324（38.8％）を含む）と同等のパフォーマンスを発揮します。

以下は、OpenHands LMと他の主要なオープンソースモデルとの比較です。 OpenHands LM Performance Comparison

このプロットが示すように、私たちの32Bパラメータのモデルは、はるかに大きなモデルに近い効率を達成しています。最大のモデル（671Bパラメータ）はわずかに高いスコアを達成しますが、私たちの32Bパラメータのモデルは非常に良好なパフォーマンスを発揮し、大きなモデルでは不可能なローカルデプロイの可能性を開拓しています。

今後の開発計画

この最初のリリースは、私たちの旅の始まりに過ぎません。私たちは、コミュニティのフィードバックと継続的な研究イニシアチブに基づいて、OpenHands LMを継続的に強化します。

特に、このモデルはまだ研究プレビュー段階であり、（1）GitHubの問題解決に関するタスクに最適で、より多様なソフトウェアエンジニアリングタスクでは性能が劣る可能性があり、（2）時々繰り返しステップを生成することがあり、（3）量子化にやや敏感で、低い量子化レベルでは完全なパフォーマンスを発揮できない可能性があります。次のリリースでは、これらの制限に対処することに焦点を当てます。

また、限られた計算リソースを持つユーザーをサポートするために、よりコンパクトなバージョンのモデル（7Bパラメータのバリアントを含む）を開発しています。これらの小さなモデルは、OpenHands LMの核心的な強みを維持しながら、ハードウェア要件を大幅に削減します。

私たちは、皆さんにOpenHands LMを試してみて、経験を共有し、その進化に参加していただくことをお勧めします。一緒に、明日のソフトウェア開発のためのより良いツールを作り上げましょう。

コミュニティへの参加

私たちは、皆さんにOpenHands LMの旅に参加していただくことをお待ちしています。

GitHubリポジトリを探索してください。
Slackで私たちとつながってください。
ドキュメントを参照して始めてください。

皆さんの経験とフィードバックを提供することで、このオープンソースイニシアチブの未来を形作る手助けになります。一緒に、明日のソフトウェア開発のためのより良いツールを作り上げましょう。

皆さんがOpenHands LMで何を作り出すか、楽しみにしています！

📄 ライセンス

このプロジェクトはMITライセンスの下でライセンスされています。

その他の情報

AWQ量子化：stelterlabによって、casper - hansenのAutoAWQ（https://github.com/casper-hansen/AutoAWQ/）を使用してINT4 GEMMで行われました。
オリジナルの重みはMistral AIによるものです。オリジナルのモデルカードは以下の通りです。

OpenHands LM v0.1

Blog • Use it in OpenHands

属性	详情
モデルタイプ	オープンコーディングモデル
トレーニングデータ	OpenHands自身が生成した多様なオープンソースリポジトリのデータ