🚀 雅意IE大模型/YAYI UIE
雅意信息抽取统一大模型 (YAYI-UIE) は、百万レベルの高品質な情報抽出データで指令微調整を行い、命名エンティティ認識(NER)、関係抽出(RE)、イベント抽出(EE)などの情報抽出タスクを統一的に訓練し、様々なシーンでの構造化抽出を実現します。
🚀 クイックスタート
このセクションでは、YAYI UIE の基本的な使い方を紹介します。
✨ 主な機能
雅意情報抽出統一大モデル (YAYI-UIE) は、百万レベルの人工構築の高品質情報抽出データで指令微調整を行い、命名エンティティ認識(NER)、関係抽出(RE)、イベント抽出(EE)などの情報抽出タスクを統一的に訓練し、通用、安全、金融、生物、医療、商業、個人、車両、映画、工業、レストラン、科学などのシーンでの構造化抽出を実現します。
このモデルのオープンソース化により、中国語事前学習大モデルのオープンソースコミュニティの発展に貢献し、すべてのパートナーと協力して雅意大モデルエコシステムを構築します。YAYI UIE モデルの詳細を知りたい場合は、GitHub リポジトリを参照してください。より詳細な技術情報については、技術レポート🔥YAYI-UIE: A Chat-Enhanced Instruction Tuning Framework for Universal Information Extraction をご覧ください。
💻 使用例
基本的な使用法
>>> import torch
>>> from transformers import AutoModelForCausalLM, AutoTokenizer
>>> from transformers.generation.utils import GenerationConfig
>>> tokenizer = AutoTokenizer.from_pretrained("wenge-research/yayi-uie", use_fast=False, trust_remote_code=True)
>>> model = AutoModelForCausalLM.from_pretrained("wenge-research/yayi-uie", device_map="auto", torch_dtype=torch.bfloat16, trust_remote_code=True)
>>> generation_config = GenerationConfig.from_pretrained("wenge-research/yayi-uie")
>>> prompt = "文本:氧化锆陶瓷以其卓越的物理和化学特性在多个行业中发挥着关键作用。这种材料因其高强度、高硬度和优异的耐磨性,广泛应用于医疗器械、切削工具、磨具以及高端珠宝制品。在制造这种高性能陶瓷时,必须遵循严格的制造标准,以确保其最终性能。这些标准涵盖了从原材料选择到成品加工的全过程,保障产品的一致性和可靠性。氧化锆的制造过程通常包括粉末合成、成型、烧结和后处理等步骤。原材料通常是高纯度的氧化锆粉末,通过精确控制的烧结工艺,这些粉末被转化成具有特定微观结构的坚硬陶瓷。这种独特的微观结构赋予氧化锆陶瓷其显著的抗断裂韧性和耐腐蚀性。此外,氧化锆陶瓷的热膨胀系数与铁类似,使其在高温应用中展现出良好的热稳定性。因此,氧化锆陶瓷不仅在工业领域,也在日常生活中的应用日益增多,成为现代材料科学中的一个重要分支。\n抽取文本中可能存在的实体,并以json{制造品名称/制造过程/制造材料/工艺参数/应用/生物医学/工程特性:[实体]}格式输出。"
>>>
>>> prompt = "<reserved_13>" + prompt + "<reserved_14>"
>>> inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
>>> response = model.generate(**inputs, max_new_tokens=512, temperature=0)
>>> print(tokenizer.decode(response[0],skip_special_tokens=True))
高度な使用法
指令サンプル
- エンティティ抽出タスク/NERタスク
文本:xx
【实体抽取】抽取文本中可能存在的实体,并以json{人物/机构/地点:[实体]}格式输出。
Text:
From the given text, extract all the entities and types. Please format the answer in json {person/organization/location:[entities]}.
- 関係抽出タスク/REタスク
文本:xx
【关系抽取】已知关系列表是[注资,拥有,纠纷,自己,增持,重组,买资,签约,持股,交易]。根据关系列表抽取关系三元组,按照json[{'relation':'', 'head':'', 'tail':''}, ]的格式输出。
Text:
From the given text, extract the possible head entities (subjects) and tail entities (objects) and give the corresponding relation triples.The relations are [country of administrative divisions,place of birth,location contains]. Output the result in json[{'relation':'', 'head':'', 'tail':''}, ].
文本:xx
抽取文本中可能存在的关系,并以json[{'关系':'会见/出席', '头实体':'', '尾实体':''}, ]格式输出。
- イベント抽出タスク/EEタスク
文本:xx
已知论元角色列表是[质押方,披露时间,质权方,质押物,质押股票/股份数量,事件时间,质押物所属公司,质押物占总股比,质押物占持股比],请根据论元角色列表从给定的输入中抽取可能的论元,以json{角色:论元,}格式输出。
Text:
Given the text and the role list [seller, place, beneficiary, buyer], identify event arguments and roles, provide your answer in the format of json{role:name}.
📚 ドキュメント
モデルzero-shot評価
NERタスク
AI、Literature、Music、Politics、Scienceは英語のデータセット、boson、clue、weiboは中国語のデータセットです。
Model |
AI |
Literature |
Music |
Politics |
Science |
EN Average |
boson |
clue |
weibo |
ZH Average |
davinci |
2.97 |
9.87 |
13.83 |
18.42 |
10.04 |
11.03 |
- |
- |
- |
31.09 |
ChatGPT 3.5 |
54.4 |
54.07 |
61.24 |
59.12 |
63 |
58.37 |
38.53 |
25.44 |
29.3 |
|
UIE |
31.14 |
38.97 |
33.91 |
46.28 |
41.56 |
38.37 |
40.64 |
34.91 |
40.79 |
38.78 |
USM |
28.18 |
56 |
44.93 |
36.1 |
44.09 |
41.86 |
- |
- |
- |
- |
InstructUIE |
49 |
47.21 |
53.16 |
48.15 |
49.3 |
49.36 |
- |
- |
- |
- |
DeepKE-LLM |
13.76 |
20.18 |
14.78 |
33.86 |
9.19 |
18.35 |
25.96 |
4.44 |
25.2 |
18.53 |
YAYI-UIE |
52.4 |
45.99 |
51.2 |
51.82 |
50.53 |
50.39 |
49.25 |
36.46 |
36.78 |
40.83 |
REタスク
FewRe、Wiki-ZSLは英語のデータセット、SKE 2020、COAE2016、IPREは中国語のデータセットです。
Model |
FewRel |
Wiki-ZSL |
EN Average |
SKE 2020 |
COAE2016 |
IPRE |
ZH Average |
ChatGPT 3.5 |
9.96 |
13.14 |
11.55 24.47 |
19.31 |
6.73 |
16.84 |
|
ZETT(T5-small) |
30.53 |
31.74 |
31.14 |
- |
- |
- |
- |
ZETT(T5-base) |
33.71 |
31.17 |
32.44 |
- |
- |
- |
- |
InstructUIE |
39.55 |
35.2 |
37.38 |
- |
- |
- |
- |
DeepKE-LLM |
17.46 |
15.33 |
16.40 |
0.4 |
6.56 |
9.75 |
5.57 |
YAYI-UIE |
36.09 |
41.07 |
38.58 |
70.8 |
19.97 |
22.97 |
37.91 |
EEタスク
commodity newsは英語のデータセット、FewFC、ccf_lawは中国語のデータセットです。
EET(イベントタイプ判別 Event Type Extraction)
模型 |
commodity news |
FewFC |
ccf_law |
ZH Average |
ChatGPT 3.5 |
1.41 |
16.15 |
0 |
8.08 |
UIE |
- |
50.23 |
2.16 |
26.20 |
InstructUIE |
23.26 |
- |
- |
- |
YAYI-UIE |
12.45 |
81.28 |
12.87 |
47.08 |
EEA(イベント引数抽出 Event Arguments Extraction)
模型 |
commodity news |
FewFC |
ccf_law |
ZH Average |
ChatGPT 3.5 |
8.6 |
44.4 |
44.57 |
44.49 |
UIE |
- |
43.02 |
60.85 |
51.94 |
InstructUIE |
21.78 |
- |
- |
- |
YAYI-UIE |
19.74 |
63.06 |
59.42 |
61.24 |

🔧 技術詳細
制限事項
現在のデータとベースモデルで訓練されたSFTモデルは、以下の問題があります。
- 抽出された情報が事実に反する誤った回答を生じる可能性があります。
- 有害な指令を適切に識別できず、有害な発言を生じる可能性があります。
- 段落レベルの長文テキストを扱うシーンでは、モデルの抽出能力はまだ向上の余地があります。
オープンソースライセンス
このプロジェクトのコードとデータは Apache-2.0 ライセンスでオープンソース化されています。YAYI UIE モデルまたはその派生物を使用する場合は、Baichuan2 のコミュニティライセンスと商用ライセンスに従ってください。
免責事項
上記のモデルの制限に基づき、開発者はこのオープンソースのコード、データ、モデルおよびこのプロジェクトから生成された派生物を研究目的のみに使用し、商業目的や社会に危害をもたらすような用途には使用しないでください。雅意大モデルが生成した内容を慎重に識別して使用し、生成された有害な内容をインターネットに拡散しないでください。悪影響が生じた場合、拡散者が責任を負います。
このプロジェクトは研究目的のみに使用でき、プロジェクト開発者はこのプロジェクト(データ、モデル、コードなどを含む)の使用によって生じる危害や損失について一切の責任を負いません。詳細は免責事項を参照してください。
📄 ライセンス
本プロジェクトは Apache-2.0 ライセンスの下で公開されています。
引用
もしあなたがこのモデルを研究に使用した場合は、以下の論文を引用してください。
@article{YAYI-UIE,
author = {Xinglin Xiao, Yijie Wang, Nan Xu, Yuqi Wang, Hanxuan Yang, Minzheng Wang, Yin Luo, Lei Wang, Wenji Mao, Dajun Zeng}},
title = {YAYI-UIE: A Chat-Enhanced Instruction Tuning Framework for Universal Information Extraction},
journal = {arXiv preprint arXiv:2312.15548},
url = {https://arxiv.org/abs/2312.15548},
year = {2023}
}