Biogpt-NERオープンソースの生物医学命名実体認識モデル

ホーム

Biogpt NER

tequilajerryによって開発

microsoft/biogptをファインチューニングした生物医学固有表現認識モデル

シーケンスラベリング

Transformers

オープンソースライセンス:MIT #生物医学固有表現認識 #NCBI疾患データセット #BioGPTファインチューニング

ダウンロード数 52

リリース時間 : 4/12/2025

モデル概要

このモデルはNCBI疾患データセットでファインチューニングされたBioGPTバージョンで、生物医学分野の固有表現認識タスクに特化しています。

モデル特徴

生物医学分野最適化

生物医学テキスト向けに特別に最適化されており、疾患関連エンティティを効果的に認識可能

BioGPTアーキテクチャベース

マイクロソフトBioGPTの強力な言語理解能力を活用してファインチューニング

効率的なトレーニング

比較的小さなトレーニングバッチ(8)と学習率(2e-05)を使用した効率的なファインチューニング

モデル能力

生物医学テキスト処理

疾患エンティティ認識

固有表現認識

使用事例

生物医学研究

文献からの疾患エンティティ抽出

生物医学文献から疾患関連エンティティを自動的に認識

臨床記録分析

臨床記録中の疾患言及を分析

プロパティ	詳細
ライブラリ名	transformers
ベースモデル	microsoft/biogpt
タグ	generated_from_trainer
データセット	ncbi_disease
モデル名	Biogpt-NER

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Biogpt NER

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Biogpt-ner

📚 ドキュメント

トレーニング手順

トレーニングハイパーパラメータ

フレームワークのバージョン

📄 ライセンス