N

Nase

aiana94によって開発
NaSEはニュース分野専用の多言語文エンコーダーで、LaBSEを基にドメイン特化トレーニングを行い、100以上の言語の文埋め込みと類似度計算をサポートします。
ダウンロード数 14
リリース時間 : 6/17/2024

モデル概要

このモデルはドメイン適応型の多言語文エンコーダーで、ニューステキストに最適化されており、ノイズ除去自己符号化と機械翻訳目標によるトレーニングを通じて、文類似度や情報検索などのタスクに適しています。

モデル特徴

ニュース分野適応
PolynewsとPolyNewsParallelデータセットを用いたドメイン特化トレーニングにより、ニューステキストの意味表現を最適化します。
多言語サポート
100以上の言語の文埋め込みをサポートし、多数の低リソース言語を含み、言語分布平滑化サンプリング戦略を採用しています。
二重トレーニング目標
ノイズ除去自己符号化(DAE)と機械翻訳(MT)目標を組み合わせ、言語間の意味捕捉能力を向上させます。

モデル能力

多言語文埋め込み
言語間文類似度計算
ニューステキスト意味検索
多言語テキストクラスタリング

使用事例

情報検索
言語間ニュース推薦
文埋め込みを用いて異なる言語のニュースの意味的類似度を計算し、言語間コンテンツ推薦を実現します。
テキスト分析
多言語ニュースクラスタリング
グローバルなニュースを意味的にクラスタリングし、言語間の類似イベント報道を識別します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase