M

Modularstarencoder

modularStarEncoderによって開発
The Stack v2データセットで事前訓練された10億パラメータのコードエンコーダー、モジュラー設計と双方向自己注意メカニズムを採用
ダウンロード数 147
リリース時間 : 2/18/2025

モデル概要

コード処理専用に設計された事前訓練エンコーダー、600以上のプログラミング言語をサポート、マルチエグジットポイントのモジュラーアーキテクチャと2048トークンのコンテキスト長を備える

モデル特徴

モジュラー設計
5つのエグジットポイントを含み、下流タスクに応じたマルチエグジットファインチューニングをサポート
効率的なアーキテクチャ
StarCoder-2の150億パラメータを10億に削減、グループ化クエリアテンション(GQA)と双方向自己注意メカニズムを採用
長文脈サポート
最大入力長を2048トークンに拡張、従来のコードエンコーダーを凌駕
多言語サポート
600以上のプログラミング言語のコード処理をサポート
訓練最適化
MLM+コンテキスト内損失の多層損失関数を採用、FlashAttention V2で高速化

モデル能力

コードスニペット埋め込み
コード表現学習
多言語コード処理
長シーケンスコード分析

使用事例

コード分析
コード類似性検出
埋め込み表現を通じてコードスニペットの意味的類似性を比較
コード検索強化
コード検索エンジンに高品質な埋め込み表現を提供
プログラミング支援
IDEインテリジェント補完
コード自動補完機能をサポートする基盤モデルとして機能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase