J

Jacolbert

Developed by bclavie
JaColBERTはColBERTを基にした初の日本語専用文書検索モデルで、強力なドメイン外汎化能力を備えています。
Downloads 859
Release Time : 12/25/2023

Model Overview

JaColBERTはColBERTを基にした初の日本語専用文書検索モデルで、文書を埋め込みベクトルの集合として表現することで、低い計算コストで優れた性能と強力なドメイン外汎化能力を実現します。

Model Features

強力なドメイン外汎化能力
評価データセットがドメイン外データであるにもかかわらず、JaColBERTは従来の日本語文書検索モデルを凌駕し、多言語モデルの性能に近づいています。
効率的なトレーニング
単一データセットの1000万トリプレットのみでトレーニングされており、密な埋め込みモデルよりもはるかに少ないデータ量で済みます。
高い計算効率
文書を埋め込みベクトルの集合として表現することで、クロスエンコーダーよりもはるかに低い計算コストで優れた性能を発揮します。

Model Capabilities

日本語文書検索
文類似性計算
意味検索

Use Cases

情報検索
質問応答システム
日本語の質問応答システムを構築し、関連文書を迅速に検索して質問に答えます。
JSQuADデータセットでR@1が0.906を達成
文書検索
日本語文書の意味検索に使用され、検索の関連性を向上させます。
MIRACLおよびMrTyDiデータセットで優れた性能を発揮
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase