L

Lodestone Base 4096 V1

Hum-Worksによって開発
Humによって開発されたsentence-transformersモデルで、4096トークンの長文埋め込みをサポートし、意味検索とクラスタリングタスクに適しています。
ダウンロード数 132
リリース時間 : 8/25/2023

モデル概要

Transformerアーキテクチャを革新した長文エンコーダで、FlashAttention、ALiBi、GLU技術を融合し、文章や段落を768次元のベクトル空間にマッピングできます。

モデル特徴

超長コンテキストサポート
ALiBi技術を通じて4096トークンの入力長に拡張され、長文書の処理に適しています。
高効率注意力機構
FlashAttentionを統合して計算効率を最適化し、Tritonの高性能実装を自動的に呼び出すことができます。
軽量設計
GPU/CPUで動作可能で、性能とリソース消費をバランスさせます。
多源訓練データ
15億の文章ペアの多領域データ(学術、質問応答、コミュニティディスカッションなど)を基に微調整されています。

モデル能力

テキストベクトル化
意味類似度計算
情報検索
テキストクラスタリング

使用事例

知識管理
学術文献検索
S2ORCデータを基に訓練された埋め込みは、論文推薦システムに使用できます。
コミュニティコンテンツ処理
質問応答ペアのマッチング
StackExchangeなどのプラットフォーム上の類似質問を識別します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase