Roberta Large Finetuned Abbr
RoBERTa-largeモデルをPLOD-unfilteredデータセットで微調整した命名エンティティ認識モデルで、科学テキスト中の略語と用語を識別するために特化しています。
ダウンロード数 64
リリース時間 : 4/20/2022
モデル概要
このモデルはRoBERTa-largeを微調整することで実現され、トークン分類タスク、特に科学文献中の特定のタイプの命名エンティティ(略語や用語など)を識別するために特化しています。
モデル特徴
高精度略語識別
科学テキスト中の様々な略語と用語を正確に識別し、F1値は0.9645に達します。
RoBERTa-largeに基づく強力な表現能力
RoBERTa-largeの事前学習モデルの強力な言語理解能力を利用し、科学文献中の複雑な用語を処理するのに特に適しています。
専門分野最適化
PLOD-unfiltered科学データセットで専用に微調整され、学術および技術文書の処理に適しています。
モデル能力
科学テキスト中の命名エンティティ認識
略語検出
用語抽出
トークン分類
使用事例
学術研究
科学文献処理
科研論文の専門用語と略語を自動識別します。
文献処理の効率を向上させ、正確率は96.08%です。
情報抽出
技術文書分析
技術マニュアルや特許文書から重要な用語を抽出します。
F1値は0.9645に達します。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98