simcse-model-roberta-base-thaiオープンソースモデル - タイ語への最適化と適合、文章を正確にベクトル空間にマッピング

ホーム

Simcse Model Roberta Base Thai

mrpによって開発

これはXLM-Rベースのsentence-transformersモデルで、特にタイ語に最適化されており、文や段落を768次元の密なベクトル空間にマッピングできます。

テキスト埋め込み

Transformers

#タイ語文埋め込み #SimCSEトレーニング #意味的類似性

ダウンロード数 69

リリース時間 : 3/2/2022

モデル概要

このモデルはSimCSE手法でトレーニングされ、主に文の類似性計算と特徴抽出タスクに使用され、特にタイ語テキスト処理に適しています。

モデル特徴

タイ語最適化

特にタイ語テキスト向けにトレーニングと最適化が行われています

SimCSEトレーニング手法

対照学習フレームワークSimCSEを使用してトレーニングされ、文の表現品質を向上させます

768次元ベクトル空間

テキストを768次元の密なベクトル空間にマッピングできます

モデル能力

文の類似性計算

テキスト特徴抽出

意味的検索

テキストクラスタリング

使用事例

情報検索

意味的検索

タイ語の意味的検索エンジンを構築

クエリの意味的意図を理解し、単なるキーワードマッチング以上の結果を提供

テキスト分析

ドキュメントクラスタリング

タイ語ドキュメントの自動分類とクラスタリング

表面的な特徴ではなく、意味的類似性に基づいてグループ化

Property	Details
Pipeline Tag	sentence-similarity
Tags	sentence-transformers, feature-extraction, sentence-similarity, transformers

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Simcse Model Roberta Base Thai

モデル概要

モデル特徴

モデル能力

使用事例

🚀 {mrp/simcse-model-roberta-base-thai}

🚀 クイックスタート

📦 インストール

💻 使用例

基本的な使用法

🔧 技術詳細