🚀 mdeberta-v3-base_finetuned_ai4privacy_v2
本模型是基于 microsoft/mdeberta-v3-base 在 ai4privacy/pii-masking-200k 数据集上进行微调的版本。它在评估集上取得了以下成果:
- 损失率:0.0323
- 整体精确率:0.9636
- 整体召回率:0.9731
- 整体 F1 值:0.9683
- 整体准确率:0.9896
🚀 快速开始
GitHub 实现:Ai4Privacy
✨ 主要特性
- 多语言支持:支持英语(en)、德语(de)、法语(fr)和意大利语(it)。
- 多指标评估:使用准确率(accuracy)、F1 值(f1)、精确率(precision)和召回率(recall)等指标进行评估。
📦 安装指南
文档未提供相关安装步骤,暂不展示。
💻 使用示例
文档未提供相关代码示例,暂不展示。
📚 详细文档
模型描述
更多信息待补充。
预期用途与限制
许可证取决于您的业务性质,您有权在项目中使用 Ai4Privacy。独立用户和小型企业(最多 3 名员工)可以免费在其产品和解决方案中使用 Ai4Privacy 的数据集和模型,并可根据商业条款有条件使用。但是,较大的盈利性组织需要公司许可证,可通过 licensing@ai4privacy.com 申请。
这种两级系统有助于为我们的项目提供资金,同时让大多数用户可以访问源代码并免费使用软件。有关确切的使用条件,请阅读以下详细条款。
免费许可证
版权所有 © 2023 Ai4Privacy
资格标准
如果您符合以下条件,则有资格免费使用 Ai4Privacy:
- 个人用户
- 员工人数最多为 3 人的盈利性实体
- 非营利组织
禁止使用场景
禁止复制或修改 Ai4Privacy 的代码,意图分发、销售、出租、许可、再许可或转授您自己基于 Ai4Privacy 贡献工作的衍生作品。
保修声明
数据集和代码“按原样”提供,不附带任何明示或暗示的保证,包括但不限于适销性、特定用途适用性和不侵权的保证。作者或版权持有者不对因数据集和模型或其使用或其他交易而产生的任何索赔、损害或其他责任(无论是合同责任、侵权责任还是其他责任)负责。
支持
我们将通过 GitHub Issues 和 Discord 尽力提供支持。企业许可证持有者可获得专门支持。
企业许可证
如果您的实体不符合免费许可证的资格,则必须购买企业许可证才能使用 Ai4Privacy。此许可证将授权您在免费许可证中概述的使用场景中使用 Ai4Privacy,并为您提供优先支持。
有关定价和许可的详细信息,请联系 licensing@ai4privacy.com。
🔧 技术细节
训练超参数
训练期间使用了以下超参数:
- 学习率(learning_rate):5e-05
- 训练批次大小(train_batch_size):32
- 评估批次大小(eval_batch_size):32
- 随机种子(seed):42
- 优化器(optimizer):Adam,β1=0.9,β2=0.999,ε=1e-06
- 学习率调度器类型(lr_scheduler_type):cosine_with_restarts
- 学习率调度器预热比率(lr_scheduler_warmup_ratio):0.2
- 训练轮数(num_epochs):5
训练结果
训练损失 |
轮数 |
步数 |
验证损失 |
整体精确率 |
整体召回率 |
整体 F1 值 |
整体准确率 |
账户名 F1 值 |
账号 F1 值 |
年龄 F1 值 |
金额 F1 值 |
BIC 码 F1 值 |
比特币地址 F1 值 |
楼号 F1 值 |
城市 F1 值 |
公司名称 F1 值 |
县 F1 值 |
信用卡 CVV 码 F1 值 |
信用卡发卡行 F1 值 |
信用卡号 F1 值 |
货币 F1 值 |
货币代码 F1 值 |
货币名称 F1 值 |
货币符号 F1 值 |
日期 F1 值 |
出生日期 F1 值 |
电子邮件 F1 值 |
以太坊地址 F1 值 |
眼睛颜色 F1 值 |
名字 F1 值 |
性别 F1 值 |
身高 F1 值 |
国际银行账号 F1 值 |
IP 地址 F1 值 |
IPv4 地址 F1 值 |
IPv6 地址 F1 值 |
工作领域 F1 值 |
职位 F1 值 |
工作类型 F1 值 |
姓氏 F1 值 |
莱特币地址 F1 值 |
MAC 地址 F1 值 |
掩码号码 F1 值 |
中间名 F1 值 |
附近 GPS 坐标 F1 值 |
方向序数 F1 值 |
密码 F1 值 |
手机 IMEI 码 F1 值 |
电话号码 F1 值 |
PIN 码 F1 值 |
前缀 F1 值 |
二级地址 F1 值 |
性别 F1 值 |
社保号 F1 值 |
州 F1 值 |
街道 F1 值 |
时间 F1 值 |
URL F1 值 |
用户代理 F1 值 |
用户名 F1 值 |
车辆 VIN 码 F1 值 |
车辆 VRM 码 F1 值 |
邮政编码 F1 值 |
0.0622 |
1.0 |
10463 |
0.0541 |
0.9247 |
0.9384 |
0.9315 |
0.9770 |
0.9949 |
0.9917 |
0.9812 |
0.9224 |
0.9847 |
0.9592 |
0.9056 |
0.9595 |
0.9802 |
0.9775 |
0.9350 |
0.9971 |
0.8939 |
0.7380 |
0.9664 |
0.0843 |
0.9721 |
0.7784 |
0.6363 |
0.9993 |
0.9877 |
0.9833 |
0.9696 |
0.9866 |
0.9716 |
0.9914 |
0.0 |
0.8238 |
0.8025 |
0.9882 |
0.9874 |
0.9878 |
0.8820 |
0.9085 |
0.9869 |
0.8831 |
0.8686 |
0.9984 |
0.9958 |
0.9786 |
0.9971 |
0.9885 |
0.9482 |
0.9455 |
0.9934 |
0.9956 |
0.9860 |
0.9673 |
0.9799 |
0.9916 |
0.9958 |
0.9995 |
0.9875 |
0.9555 |
0.9819 |
0.9311 |
0.0492 |
2.0 |
20926 |
0.0445 |
0.9376 |
0.9494 |
0.9434 |
0.9788 |
0.9970 |
0.9979 |
0.9883 |
0.9492 |
0.9949 |
0.9626 |
0.9548 |
0.9819 |
0.9911 |
0.9922 |
0.9740 |
0.9985 |
0.9057 |
0.5805 |
0.9771 |
0.4872 |
0.9734 |
0.8257 |
0.7479 |
0.9989 |
0.9944 |
0.9960 |
0.9819 |
0.9933 |
0.9958 |
0.9962 |
0.1521 |
0.7969 |
0.8083 |
0.9957 |
0.9972 |
0.9970 |
0.9335 |
0.8953 |
0.9967 |
0.8786 |
0.9232 |
1.0 |
0.9980 |
0.9868 |
0.9985 |
0.9967 |
0.9808 |
0.9708 |
0.9969 |
0.9979 |
0.9980 |
0.9921 |
0.9913 |
0.9979 |
1.0 |
1.0 |
0.9914 |
0.9788 |
0.9859 |
0.9622 |
0.0392 |
3.0 |
31389 |
0.0395 |
0.9458 |
0.9584 |
0.9521 |
0.9815 |
0.9988 |
0.9971 |
0.9861 |
0.9573 |
0.9955 |
0.9764 |
0.9518 |
0.9836 |
0.9914 |
0.9921 |
0.9802 |
0.9985 |
0.9300 |
0.8115 |
0.9862 |
0.5935 |
0.9821 |
0.8684 |
0.7870 |
0.9994 |
0.9972 |
0.9976 |
0.9860 |
0.9956 |
0.9981 |
0.9964 |
0.3002 |
0.8302 |
0.7274 |
0.9863 |
0.9968 |
0.9979 |
0.9528 |
0.9208 |
0.9881 |
0.9195 |
0.9269 |
0.9992 |
0.9980 |
0.9894 |
0.9998 |
0.9984 |
0.9750 |
0.9767 |
0.9971 |
0.9972 |
0.9978 |
0.9927 |
0.9952 |
0.9966 |
1.0 |
0.9997 |
0.9962 |
0.9942 |
0.9937 |
0.9653 |
0.0311 |
4.0 |
41852 |
0.0341 |
0.9537 |
0.9667 |
0.9601 |
0.9855 |
0.9998 |
0.9986 |
0.9869 |
0.9545 |
0.9961 |
0.9774 |
0.9632 |
0.9885 |
0.9952 |
0.9940 |
0.9838 |
0.9985 |
0.9392 |
0.8567 |
0.9863 |
0.7015 |
0.9853 |
0.9158 |
0.8687 |
1.0 |
0.9979 |
0.9984 |
0.9875 |
0.9971 |
1.0 |
0.9962 |
0.4882 |
0.8664 |
0.6966 |
0.9927 |
0.9973 |
0.9967 |
0.9583 |
0.9251 |
0.9979 |
0.9275 |
0.9351 |
1.0 |
0.9988 |
0.9932 |
0.9998 |
0.9980 |
0.9852 |
0.9760 |
0.9983 |
0.9980 |
0.9985 |
0.9932 |
0.9952 |
0.9966 |
0.9996 |
1.0 |
0.9969 |
0.9955 |
0.9942 |
0.9685 |
0.0196 |
5.0 |
52315 |
0.0323 |
0.9636 |
0.9731 |
0.9683 |
0.9896 |
0.9998 |
0.9973 |
0.9878 |
0.9495 |
0.9932 |
0.9704 |
0.9648 |
0.9887 |
0.9942 |
0.9940 |
0.9820 |
0.9985 |
0.9570 |
0.8750 |
0.9888 |
0.7416 |
0.9819 |
0.9295 |
0.8946 |
0.9998 |
0.9965 |
0.9984 |
0.9886 |
0.9962 |
1.0 |
0.9966 |
0.6284 |
0.8884 |
0.8015 |
0.9940 |
0.9973 |
0.9970 |
0.9653 |
0.9109 |
0.9992 |
0.9524 |
0.9347 |
1.0 |
0.9984 |
0.9936 |
0.9998 |
0.9992 |
0.9857 |
0.9801 |
0.9988 |
0.9979 |
0.9983 |
0.9944 |
0.9953 |
0.9974 |
1.0 |
1.0 |
0.9966 |
0.9936 |
0.9917 |
0.9727 |
框架版本
- Transformers 4.35.2
- Pytorch 2.1.0+cu121
- Datasets 2.16.1
- Tokenizers 0.15.0
📄 许可证
本模型使用的许可证为 cc-by-nc-4.0。