🚀 文章類似度モデルプロジェクト
このプロジェクトは sentence-transformers
に基づいており、文章の類似度計算と特徴抽出に使用できます。様々なテキスト情報を効果的に処理し、関連分野のアプリケーションに強力なサポートを提供します。
📦 モデル情報
プロパティ |
詳細 |
モデルタイプ |
sentence-transformers/paraphrase-mpnet-base-v2 をベースに微調整されたモデル |
訓練データ規模 |
6241 |
損失関数 |
コサイン類似度損失(CosineSimilarityLoss) |
💻 使用例
基本的な使用法
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('your_model_path')
source_sentence = "Professional SummarySeeking a position as an electrical engineer at the management level. Licensed Professional Electrical Engineer with over fifteen years of extensive and progressive professional experience in the Mass Transit and Electric Power Utility Industries. Currently serve as a lead engineer and technical expert for supporting and coordinating multiple complex electrical engineering projects for all Pepco's transmission and distribution substations."
sentences = ["Centurion Consulting Group is looking for a Software Development Manager This is a DIRECT HIRE and requires a local candidate in Mclean, VA. This role is a hybrid role.", "Position: Cost Accountant Reports to: President The CompanyWith double-digit annual growth rate since our founding in 1998, we are continuing to expand our dynamic team. As a contract manufacturer for in-vitro diagnostics, we make sure great products get made. The Natech learning organization develops collaborative problem solvers who help our customers launch and scale new medical devices."]
source_embedding = model.encode(source_sentence)
sentence_embeddings = model.encode(sentences)
高度な使用法
import concurrent.futures
from sentence_transformers import SentenceTransformer
model = SentenceTransformer('your_model_path')
source_sentence = "Professional SummarySeeking a position as an electrical engineer at the management level. Licensed Professional Electrical Engineer with over fifteen years of extensive and progressive professional experience in the Mass Transit and Electric Power Utility Industries. Currently serve as a lead engineer and technical expert for supporting and coordinating multiple complex electrical engineering projects for all Pepco's transmission and distribution substations."
sentences = ["Centurion Consulting Group is looking for a Software Development Manager This is a DIRECT HIRE and requires a local candidate in Mclean, VA. This role is a hybrid role.", "Position: Cost Accountant Reports to: President The CompanyWith double-digit annual growth rate since our founding in 1998, we are continuing to expand our dynamic team. As a contract manufacturer for in-vitro diagnostics, we make sure great products get made. The Natech learning organization develops collaborative problem solvers who help our customers launch and scale new medical devices."]
def encode_sentence(sentence):
return model.encode(sentence)
with concurrent.futures.ThreadPoolExecutor() as executor:
sentence_embeddings = list(executor.map(encode_sentence, sentences))
source_embedding = model.encode(source_sentence)
📚 ドキュメント
ソース文章の詳細
ソース文章は電気エンジニアのプロフェッショナル履歴書で、職業目標、職務経験、プロジェクト管理、コミュニケーション能力など、電気工事プロジェクトにおける豊富な経験と専門技術を示しています。
比較対象文章の詳細
- 第一文:Centurion コンサルティンググループはソフトウェア開発マネージャーを募集しています。この職位は直接採用で、バージニア州マクリーンの地元の候補者を求めており、勤務形態はハイブリッド勤務です。この職位の主な職責や基本的な雇用資格などの情報が詳細に説明されています。
- 第二文:コスト会計を募集しています。この会社は 1998 年に設立されて以来、二桁の年間成長率を維持し、チームを拡大しています。この職位は主に、会社の会計システムを新しいレベルに引き上げ、上場親会社との統合作業を管理することを担当し、職務内容や最低雇用資格などが記載されています。
このモデルを使用することで、ソース文章とこれらの比較対象文章の間の類似度を計算し、関連するテキストマッチングや情報検索などのアプリケーションにサポートを提供できます。