M

Moco Sentencedistilbertv2.0

Developed by bongsoo
これはsentence-transformersに基づく韓英バイリンガルの文埋め込みモデルで、文を768次元のベクトル空間にマッピングでき、意味検索やクラスタリングタスクに適しています。
Downloads 39
Release Time : 9/5/2022

Model Overview

このモデルはmdistilbertV1.1を改良し、320万文のmoco-corpusを使って訓練され、STSの教師 - 生徒蒸留訓練によって構築され、韓語と英語の文の類似度計算をサポートします。

Model Features

バイリンガルサポート
韓語と英語の文の埋め込み表現を同時にサポートします
効率的な蒸留
教師 - 生徒蒸留訓練によってモデルの性能を向上させます
大規模訓練
320万文のmoco-corpusを使って訓練します
語彙の最適化
語彙数を164,314個に拡張し、元のモデルより17,870個の新しい語彙を追加しました

Model Capabilities

文埋め込み
意味類似度計算
テキストクラスタリング
異言語検索

Use Cases

情報検索
異言語文書検索
韓語と英語が混在する文書庫から意味的に類似した文書を検索します
異なる言語間で意味的に類似した文書を効果的に識別できます
質問応答システム
質問のマッチング
ユーザーの質問と知識ベース内の類似した質問をマッチングします
例に示すように、「韓国の首都は?」と「ソウルは韓国の首都です」の意味的な類似性を正確に識別できます
コンテンツ推薦
類似コンテンツの推薦
コンテンツの意味的な類似性に基づいて関連する記事や製品を推薦します
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase