🚀 卡门伯特关键词提取器
本项目是一个基于camembert-base模型的微调版本,在未知数据集上进行了训练。该模型在评估集上取得了以下效果:
- 损失值:0.2199
- 精确率:0.6743
- 召回率:0.6979
- 准确率:0.9346
- F1值:0.6859
🚀 快速开始
本模型是camembert-base在未知数据集上的微调版本。在评估集上,它取得了如下结果:
- 损失:0.2199
- 精确率:0.6743
- 召回率:0.6979
- 准确率:0.9346
- F1值:0.6859
📚 详细文档
模型描述
更多信息待补充。
预期用途与限制
更多信息待补充。
训练和评估数据
更多信息待补充。
训练过程
训练超参数
训练过程中使用了以下超参数:
- 学习率:2e - 05
- 训练批次大小:16
- 评估批次大小:16
- 随机种子:42
- 优化器:Adam(β1 = 0.9,β2 = 0.999,ε = 1e - 08)
- 学习率调度器类型:线性
- 训练轮数:8
- 混合精度训练:原生自动混合精度(Native AMP)
训练结果
训练损失 |
轮数 |
步数 |
验证损失 |
精确率 |
召回率 |
准确率 |
F1值 |
0.1747 |
1.0 |
1875 |
0.1780 |
0.5935 |
0.7116 |
0.9258 |
0.6472 |
0.1375 |
2.0 |
3750 |
0.1588 |
0.6505 |
0.7032 |
0.9334 |
0.6759 |
0.1147 |
3.0 |
5625 |
0.1727 |
0.6825 |
0.6689 |
0.9355 |
0.6756 |
0.0969 |
4.0 |
7500 |
0.1759 |
0.6886 |
0.6621 |
0.9350 |
0.6751 |
0.0837 |
5.0 |
9375 |
0.1967 |
0.6688 |
0.7112 |
0.9348 |
0.6893 |
0.0746 |
6.0 |
11250 |
0.2088 |
0.6646 |
0.7114 |
0.9334 |
0.6872 |
0.0666 |
7.0 |
13125 |
0.2169 |
0.6713 |
0.7054 |
0.9347 |
0.6879 |
0.0634 |
8.0 |
15000 |
0.2199 |
0.6743 |
0.6979 |
0.9346 |
0.6859 |
框架版本
- Transformers:4.19.2
- Pytorch:1.11.0 + cu113
- Datasets:2.2.2
- Tokenizers:0.12.1
📄 许可证
本项目采用MIT许可证。
标签
- 由训练器生成
- 指标:精确率、召回率、准确率、F1值
- 语言:法语
示例文本
- “共和国总统还呼吁法国人民选择一个‘稳定且严肃的多数派,以保护他们免受危机影响,并为未来采取行动’。他表示:‘我在让 - 吕克·梅朗雄或勒庞夫人的计划中看到的是混乱和屈服的计划。他们声称要退出我们的联盟、退出欧洲,并与俄罗斯建立战略联盟。这是向俄罗斯屈服’。”
- “投票站开放首日形势良好。波利尼西亚和居住在国外的法国人,其中一些人已经可以在线投票,本周末将参加立法选举首轮投票,6月4日星期六是美洲大陆和加勒比地区,6月5日星期日是世界其他地区。在法国本土,首轮和第二轮投票将分别于6月12日和19日举行。”
- “国防部还表示,俄罗斯导弹袭击了苏梅地区的一个炮兵训练中心,那里有外国教官在工作。此外,另一次袭击摧毁了敖德萨地区的一个‘外国雇佣兵’据点。”
- “不满情绪很深,类似一场存在主义危机。在外交部极为罕见的是,六个工会和一个由500名年轻外交官组成的团体于6月2日星期四呼吁举行罢工,以抗议高级公务员改革,该改革最终将导致法国外交两个历史悠久的职位消失:全权公使(大使)和外交事务顾问。”
- “他们冒充洛克希德·马丁公司或英国国防和航空航天巨头BAE系统公司的招聘人员。这些所谓的猎头描绘了诱人的职业前景和责任重大的职位。但这只是空谈。实际上,他们是朝鲜网络间谍,试图窃取国防集团或航空航天领域的工业机密,斯洛伐克网络安全公司Eset在5月31日星期二发布的一份报告中揭露了这一情况。”