G

Gte En Mlm Base

Developed by Alibaba-NLP
GTE-v1.5シリーズの英語テキストエンコーダーで、BERTアーキテクチャを改良し、最大8192のコンテキスト長をサポート、英語テキスト表現タスクに適しています。
Downloads 231
Release Time : 8/6/2024

Model Overview

このモデルはGTE-v1.5シリーズの英語テキストエンコーダーで、transformer++エンコーダーアーキテクチャ(BERT + RoPE + GLU)に基づき、英語テキスト表現のために設計され、長いコンテキスト処理をサポートします。

Model Features

長いコンテキストサポート
最大8192のコンテキスト長をサポートし、長文書や複雑なテキストの処理に適しています。
改良されたアーキテクチャ
BERTアーキテクチャを改良し、RoPEとGLUを追加することで、モデルの性能を向上させました。
段階的なトレーニング
段階的なトレーニング戦略を採用し、まず短いシーケンスで事前学習を行い、その後長いシーケンスで微調整を行うことで、長文処理能力を最適化しました。

Model Capabilities

テキストエンコーディング
長文処理
マスク言語モデリング

Use Cases

情報検索
ドキュメント検索
長文書の検索とマッチングに使用され、検索システムの精度を向上させます。
自然言語処理
テキスト表現
高品質なテキスト埋め込みを生成し、下流のNLPタスクに使用します。
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase