Scincl Wol
SciDocsの漏洩データを使用せずにトレーニングされた科学文献埋め込みモデル
ダウンロード数 127
リリース時間 : 3/7/2022
モデル概要
SciNCLは科学文献に特化した埋め込みモデルで、SciDocsデータセットの漏洩問題を回避することで性能を向上させています。
モデル特徴
データ漏洩なしのトレーニング
SciDocsデータセットの漏洩データを使用せず、モデル評価の公平性を確保
科学文献最適化
科学文献の内容に特化して最適化され、科学概念間の複雑な関係を捉える
モデル能力
科学文献埋め込み
意味的類似度計算
科学概念検索
使用事例
学術研究
関連文献検索
科学概念に基づいて関連研究論文を検索
一般的な埋め込みモデルと比べて科学概念間の関連性をより正確に識別
文献推薦システム
研究者に関連分野の最新研究を推薦
知識管理
科学知識グラフ構築
科学概念間の関連ネットワークを自動構築
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98