T

Turkish Base Bert Uncased Mean Nli Stsb Tr

atasogluによって開発
これはトルコ語BERTモデルに基づく文埋め込みモデルで、文の類似度計算や意味的検索タスクに適しています。
ダウンロード数 744
リリース時間 : 2/17/2024

モデル概要

このモデルはトルコ語の文や段落を768次元の稠密ベクトル空間にマッピングでき、クラスタリングや意味的検索などのタスクに適しています。ytu - ce - cosmos/turkish - base - bert - uncasedをベースに微調整され、訓練データセットにはnli_trとemrecan/stsb - mt - turkishが含まれています。

モデル特徴

トルコ語最適化
トルコ語に特化して最適化および微調整されており、トルコ語テキストの処理に適しています。
文埋め込み
文や段落を768次元の稠密ベクトル空間にマッピングでき、意味情報を保持します。
小文字処理
入力テキストを手動で小文字に変換する必要があり、特殊文字(例えば、'I'を'ı'に)も含みます。
高性能
STS - bテストセットで優れた性能を発揮し、コサイン類似度のピアソン相関係数が0.8401に達します。

モデル能力

文の類似度計算
意味的検索
テキストクラスタリング
特徴抽出

使用事例

情報検索
意味的検索
トルコ語の意味的検索エンジンを構築するために使用され、クエリに基づいて意味的に類似したドキュメントを返します。
検索結果の関連性を向上させる
テキスト分析
ドキュメントクラスタリング
トルコ語のドキュメントを自動的にクラスタリングし、類似したドキュメントグループを見つけます。
ドキュメントの整理効率を向上させる
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase