Pegasus Indian Legal
该模型是基于legal-pegasus在印度法律数据集上微调的法律文本摘要模型
下载量 104
发布时间 : 12/8/2023
模型简介
一个针对印度法律文本优化的Pegasus摘要模型,能够生成法律文档的简洁摘要
模型特点
法律领域优化
专门针对印度法律文本进行微调,能更好地理解法律术语和结构
高效摘要
能够从冗长的法律文档中提取关键信息生成简洁摘要
模型能力
法律文本摘要
关键信息提取
文档压缩
使用案例
法律行业
法律文书摘要
为律师和法官快速生成案件文档的摘要
节省法律专业人士的阅读时间
法律研究辅助
帮助研究人员快速浏览大量法律文献
提高法律研究效率
🚀 pegasus_indian_legal
该模型是 nsi319/legal-pegasus 在 ninadn/indian-legal 数据集上的微调版本。它在评估集上取得了以下结果:
- 损失值:3.8207
🚀 快速开始
本模型是在特定数据集上对基础模型进行微调得到的,可用于相关法律文本处理任务。你可以根据自己的需求,结合 Hugging Face 的相关工具来使用该模型。
🔧 技术细节
训练超参数
在训练过程中使用了以下超参数:
- 学习率(learning_rate):5e-05
- 训练批次大小(train_batch_size):1
- 评估批次大小(eval_batch_size):1
- 随机种子(seed):42
- 优化器(optimizer):Adam,其中 betas=(0.9, 0.999),epsilon=1e-08
- 学习率调度器类型(lr_scheduler_type):线性
- 学习率调度器预热步数(lr_scheduler_warmup_steps):5
- 训练轮数(num_epochs):5
训练结果
训练损失 | 轮数 | 步数 | 验证损失 |
---|---|---|---|
8.1139 | 0.01 | 5 | 7.1952 |
7.7414 | 0.01 | 10 | 6.8118 |
6.6586 | 0.01 | 15 | 6.6204 |
6.1226 | 0.02 | 20 | 6.5303 |
6.7833 | 0.03 | 25 | 6.4668 |
5.9004 | 0.03 | 30 | 6.4014 |
7.1037 | 0.04 | 35 | 6.3302 |
6.4414 | 0.04 | 40 | 6.2744 |
7.0245 | 0.04 | 45 | 6.2331 |
7.4426 | 0.05 | 50 | 6.1970 |
7.4032 | 0.06 | 55 | 6.1663 |
6.2171 | 0.06 | 60 | 6.1440 |
8.762 | 0.07 | 65 | 6.1259 |
7.9691 | 0.07 | 70 | 6.0915 |
7.8924 | 0.07 | 75 | 6.0554 |
5.6221 | 0.08 | 80 | 6.0259 |
6.3625 | 0.09 | 85 | 5.9976 |
6.7371 | 0.09 | 90 | 5.9720 |
6.3414 | 0.1 | 95 | 5.9505 |
6.1663 | 0.1 | 100 | 5.9328 |
5.1981 | 0.1 | 105 | 5.9121 |
6.8607 | 0.11 | 110 | 5.8904 |
6.8116 | 0.12 | 115 | 5.8700 |
5.9565 | 0.12 | 120 | 5.8479 |
5.5946 | 0.12 | 125 | 5.8239 |
6.856 | 0.13 | 130 | 5.7999 |
6.2926 | 0.14 | 135 | 5.7736 |
6.7472 | 0.14 | 140 | 5.7444 |
6.5017 | 0.14 | 145 | 5.7151 |
7.1512 | 0.15 | 150 | 5.6817 |
6.7095 | 0.15 | 155 | 5.6471 |
6.2288 | 0.16 | 160 | 5.6049 |
5.65 | 0.17 | 165 | 5.5605 |
5.922 | 0.17 | 170 | 5.5073 |
5.7808 | 0.17 | 175 | 5.4596 |
5.4964 | 0.18 | 180 | 5.4131 |
5.8934 | 0.18 | 185 | 5.3834 |
6.6113 | 0.19 | 190 | 5.3575 |
6.2676 | 0.2 | 195 | 5.3370 |
5.9186 | 0.2 | 200 | 5.3093 |
6.6886 | 0.2 | 205 | 5.2713 |
5.1807 | 0.21 | 210 | 5.2369 |
6.1971 | 0.21 | 215 | 5.2052 |
5.766 | 0.22 | 220 | 5.1839 |
5.9246 | 0.23 | 225 | 5.1648 |
6.4893 | 0.23 | 230 | 5.1442 |
5.3428 | 0.23 | 235 | 5.1130 |
5.7767 | 0.24 | 240 | 5.0839 |
5.9352 | 0.24 | 245 | 5.0620 |
5.6338 | 0.25 | 250 | 5.0522 |
5.8564 | 0.26 | 255 | 5.0327 |
5.7787 | 0.26 | 260 | 5.0045 |
5.6463 | 0.27 | 265 | 4.9912 |
4.9419 | 0.27 | 270 | 4.9718 |
6.0014 | 0.28 | 275 | 4.9586 |
4.8812 | 0.28 | 280 | 4.9486 |
5.6219 | 0.28 | 285 | 4.9317 |
5.4921 | 0.29 | 290 | 4.9131 |
5.4535 | 0.29 | 295 | 4.8967 |
5.1836 | 0.3 | 300 | 4.8764 |
4.3432 | 0.3 | 305 | 4.8662 |
4.8323 | 0.31 | 310 | 4.8564 |
4.7862 | 0.32 | 315 | 4.8482 |
5.3593 | 0.32 | 320 | 4.8367 |
5.2734 | 0.33 | 325 | 4.8283 |
6.5221 | 0.33 | 330 | 4.8119 |
5.5495 | 0.34 | 335 | 4.7992 |
5.2248 | 0.34 | 340 | 4.7875 |
6.1969 | 0.34 | 345 | 4.7771 |
4.9022 | 0.35 | 350 | 4.7666 |
5.0548 | 0.35 | 355 | 4.7528 |
4.1457 | 0.36 | 360 | 4.7516 |
5.4985 | 0.36 | 365 | 4.7376 |
4.7874 | 0.37 | 370 | 4.7305 |
5.2283 | 0.38 | 375 | 4.7214 |
4.4285 | 0.38 | 380 | 4.7117 |
5.5889 | 0.39 | 385 | 4.6993 |
5.0003 | 0.39 | 390 | 4.6923 |
6.2434 | 0.4 | 395 | 4.6796 |
5.4728 | 0.4 | 400 | 4.6681 |
4.4054 | 0.41 | 405 | 4.6598 |
4.6877 | 0.41 | 410 | 4.6559 |
4.8273 | 0.41 | 415 | 4.6557 |
4.8691 | 0.42 | 420 | 4.6500 |
5.991 | 0.42 | 425 | 4.6416 |
5.4251 | 0.43 | 430 | 4.6384 |
4.9538 | 0.43 | 435 | 4.6269 |
5.0589 | 0.44 | 440 | 4.6172 |
5.4516 | 0.45 | 445 | 4.6078 |
4.5009 | 0.45 | 450 | 4.6025 |
5.1187 | 0.46 | 455 | 4.5974 |
5.6275 | 0.46 | 460 | 4.5826 |
5.4156 | 0.47 | 465 | 4.5821 |
5.2567 | 0.47 | 470 | 4.5745 |
5.2155 | 0.47 | 475 | 4.5683 |
5.0582 | 0.48 | 480 | 4.5585 |
4.8753 | 0.48 | 485 | 4.5480 |
5.0787 | 0.49 | 490 | 4.5415 |
4.9567 | 0.49 | 495 | 4.5393 |
4.5857 | 0.5 | 500 | 4.5349 |
4.8612 | 0.51 | 505 | 4.5285 |
4.8277 | 0.51 | 510 | 4.5240 |
5.5906 | 0.52 | 515 | 4.5260 |
4.9499 | 0.52 | 520 | 4.5173 |
5.2952 | 0.53 | 525 | 4.5060 |
3.8274 | 0.53 | 530 | 4.4994 |
4.467 | 0.54 | 535 | 4.4962 |
5.0859 | 0.54 | 540 | 4.4934 |
4.3718 | 0.55 | 545 | 4.4885 |
4.4206 | 0.55 | 550 | 4.4825 |
4.5786 | 0.56 | 555 | 4.4792 |
4.9051 | 0.56 | 560 | 4.4704 |
5.2053 | 0.56 | 565 | 4.4670 |
4.4463 | 0.57 | 570 | 4.4657 |
5.7765 | 0.57 | 575 | 4.4616 |
4.8999 | 0.58 | 580 | 4.4641 |
4.6483 | 0.58 | 585 | 4.4553 |
5.4009 | 0.59 | 590 | 4.4444 |
5.1194 | 0.59 | 595 | 4.4451 |
4.7166 | 0.6 | 600 | 4.4393 |
4.8541 | 0.6 | 605 | 4.4360 |
4.7013 | 0.61 | 610 | 4.4320 |
5.4653 | 0.61 | 615 | 4.4303 |
5.0875 | 0.62 | 620 | 4.4255 |
5.1023 | 0.62 | 625 | 4.4223 |
4.6522 | 0.63 | 630 | 4.4194 |
4.8696 | 0.64 | 635 | 4.4139 |
5.2916 | 0.64 | 640 | 4.4094 |
4.8809 | 0.65 | 645 | 4.3972 |
5.0182 | 0.65 | 650 | 4.3930 |
4.9865 | 0.66 | 655 | 4.3878 |
4.8155 | 0.66 | 660 | 4.3860 |
5.5128 | 0.67 | 665 | 4.3792 |
5.076 | 0.67 | 670 | 4.3760 |
4.5312 | 0.68 | 675 | 4.3725 |
5.0691 | 0.68 | 680 | 4.3696 |
4.4553 | 0.69 | 685 | 4.3657 |
5.0 | 0.69 | 690 | 4.3588 |
4.3969 | 0.69 | 695 | 4.3574 |
4.7947 | 0.7 | 700 | 4.3534 |
5.2797 | 0.7 | 705 | 4.3471 |
4.3235 | 0.71 | 710 | 4.3432 |
4.8813 | 0.71 | 715 | 4.3424 |
4.4267 | 0.72 | 720 | 4.3413 |
4.987 | 0.72 | 725 | 4.3404 |
5.2805 | 0.73 | 730 | 4.3393 |
5.1594 | 0.73 | 735 | 4.3417 |
5.1164 | 0.74 | 740 | 4.3337 |
5.4437 | 0.74 | 745 | 4.3319 |
5.2844 | 0.75 | 750 | 4.3359 |
4.4978 | 0.76 | 755 | 4.3310 |
5.2737 | 0.76 | 760 | 4.3214 |
5.3885 | 0.77 | 765 | 4.3177 |
5.0851 | 0.77 | 770 | 4.3134 |
4.2761 | 0.78 | 775 | 4.3131 |
4.824 | 0.78 | 780 | 4.3051 |
4.5129 | 0.79 | 785 | 4.2968 |
4.7519 | 0.79 | 790 | 4.2943 |
4.4831 | 0.8 | 795 | 4.2971 |
4.6433 | 0.8 | 800 | 4.2932 |
4.4866 | 0.81 | 805 | 4.2881 |
4.589 | 0.81 | 810 | 4.2862 |
4.2021 | 0.81 | 815 | 4.2836 |
4.8308 | 0.82 | 820 | 4.2816 |
4.8649 | 0.82 | 825 | 4.2806 |
4.9864 | 0.83 | 830 | 4.2788 |
4.2605 | 0.83 | 835 | 4.2721 |
4.4628 | 0.84 | 840 | 4.2669 |
4.682 | 0.84 | 845 | 4.2690 |
4.3174 | 0.85 | 850 | 4.2702 |
4.3081 | 0.85 | 855 | 4.2675 |
5.0759 | 0.86 | 860 | 4.2642 |
4.6884 | 0.86 | 865 | 4.2619 |
5.1781 | 0.87 | 870 | 4.2591 |
4.3708 | 0.88 | 875 | 4.2581 |
4.5789 | 0.88 | 880 | 4.2546 |
5.038 | 0.89 | 885 | 4.2526 |
5.3472 | 0.89 | 890 | 4.2571 |
5.0421 | 0.9 | 895 | 4.2505 |
4.4187 | 0.9 | 900 | 4.2472 |
5.1907 | 0.91 | 905 | 4.2506 |
4.4268 | 0.91 | 910 | 4.2513 |
5.0916 | 0.92 | 915 | 4.2449 |
4.8503 | 0.92 | 920 | 4.2410 |
4.2652 | 0.93 | 925 | 4.2357 |
4.812 | 0.93 | 930 | 4.2317 |
5.084 | 0.94 | 935 | 4.2310 |
5.7428 | 0.94 | 940 | 4.2257 |
5.3298 | 0.94 | 945 | 4.2259 |
4.0464 | 0.95 | 950 | 4.2259 |
5.0414 | 0.95 | 955 | 4.2212 |
5.1559 | 0.96 | 960 | 4.2186 |
4.7129 | 0.96 | 965 | 4.2227 |
4.4059 | 0.97 | 970 | 4.2243 |
4.4548 | 0.97 | 975 | 4.2169 |
4.6622 | 0.98 | 980 | 4.2075 |
5.1651 | 0.98 | 985 | 4.2058 |
4.6515 | 0.99 | 990 | 4.2071 |
4.9588 | 0.99 | 995 | 4.2071 |
4.7649 | 1.0 | 1000 | 4.2091 |
4.7989 | 1.0 | 1005 | 4.2076 |
4.7028 | 1.01 | 1010 | 4.2019 |
5.0315 | 1.01 | 1015 | 4.1994 |
4.0678 | 1.02 | 1020 | 4.1973 |
4.1186 | 1.02 | 1025 | 4.1941 |
4.448 | 1.03 | 1030 | 4.1908 |
4.7813 | 1.03 | 1035 | 4.1892 |
5.0336 | 1.04 | 1040 | 4.1872 |
4.7727 | 1.04 | 1045 | 4.1857 |
4.5824 | 1.05 | 1050 | 4.1863 |
3.9989 | 1.05 | 1055 | 4.1859 |
4.5373 | 1.06 | 1060 | 4.1833 |
4.8955 | 1.06 | 1065 | 4.1789 |
4.8222 | 1.07 | 1070 | 4.1780 |
4.6521 | 1.07 | 1075 | 4.1790 |
4.1452 | 1.08 | 1080 | 4.1775 |
4.7654 | 1.08 | 1085 | 4.1757 |
4.1216 | 1.09 | 1090 | 4.1762 |
4.5188 | 1.09 | 1095 | 4.1720 |
4.8948 | 1.1 | 1100 | 4.1717 |
5.3199 | 1.1 | 1105 | 4.1719 |
4.7887 | 1.11 | 1110 | 4.1727 |
4.7932 | 1.11 | 1115 | 4.1692 |
4.1068 | 1.12 | 1120 | 4.1658 |
4.7401 | 1.12 | 1125 | 4.1670 |
4.6968 | 1.13 | 1130 | 4.1661 |
4.4696 | 1.14 | 1135 | 4.1646 |
4.2353 | 1.14 | 1140 | 4.1612 |
4.2536 | 1.15 | 1145 | 4.1586 |
4.3728 | 1.15 | 1150 | 4.1582 |
4.9408 | 1.16 | 1155 | 4.1550 |
4.6785 | 1.16 | 1160 | 4.1516 |
4.3829 | 1.17 | 1165 | 4.1534 |
4.9909 | 1.17 | 1170 | 4.1584 |
4.1406 | 1.18 | 1175 | 4.1584 |
4.9504 | 1.18 | 1180 | 4.1542 |
4.7331 | 1.19 | 1185 | 4.1539 |
5.1361 | 1.19 | 1190 | 4.1543 |
5.0294 | 1.2 | 1195 | 4.1492 |
4.595 | 1.2 | 1200 | 4.1478 |
4.2045 | 1.21 | 1205 | 4.1483 |
4.2644 | 1.21 | 1210 | 4.1491 |
4.3578 | 1.22 | 1215 | 4.1458 |
5.0108 | 1.22 | 1220 | 4.1367 |
4.8417 | 1.23 | 1225 | 4.1332 |
4.7314 | 1.23 | 1230 | 4.1334 |
4.38 | 1.23 | 1235 | 4.1399 |
4.8438 | 1.24 | 1240 | 4.1350 |
4.4486 | 1.25 | 1245 | 4.1304 |
4.2011 | 1.25 | 1250 | 4.1297 |
5.0078 | 1.25 | 1255 | 4.1320 |
4.9064 | 1.26 | 1260 | 4.1347 |
4.8337 | 1.27 | 1265 | 4.1331 |
4.5072 | 1.27 | 1270 | 4.1288 |
5.1174 | 1.27 | 1275 | 4.1259 |
4.9408 | 1.28 | 1280 | 4.1269 |
4.3618 | 1.28 | 1285 | 4.1325 |
4.4125 | 1.29 | 1290 | 4.1313 |
4.5327 | 1.29 | 1295 | 4.1215 |
4.9565 | 1.3 | 1300 | 4.1188 |
4.5604 | 1.3 | 1305 | 4.1207 |
4.8142 | 1.31 | 1310 | 4.1203 |
4.2889 | 1.31 | 1315 | 4.1161 |
5.1939 | 1.32 | 1320 | 4.1131 |
4.945 | 1.32 | 1325 | 4.1114 |
4.1199 | 1.33 | 1330 | 4.1099 |
4.7964 | 1.33 | 1335 | 4.1061 |
4.3781 | 1.34 | 1340 | 4.1028 |
4.9565 | 1.34 | 1345 | 4.1014 |
5.3126 | 1.35 | 1350 | 4.1021 |
4.5448 | 1.35 | 1355 | 4.1016 |
4.3571 | 1.36 | 1360 | 4.1007 |
4.326 | 1.36 | 1365 | 4.0991 |
4.4253 | 1.37 | 1370 | 4.0985 |
4.5005 | 1.38 | 1375 | 4.1032 |
4.6244 | 1.38 | 1380 | 4.1051 |
3.8342 | 1.39 | 1385 | 4.1015 |
4.0543 | 1.39 | 1390 | 4.0978 |
4.6442 | 1.4 | 1395 | 4.0983 |
4.3291 | 1.4 | 1400 | 4.0963 |
4.5691 | 1.41 | 1405 | 4.0945 |
4.9671 | 1.41 | 1410 | 4.0954 |
4.5716 | 1.42 | 1415 | 4.0972 |
3.902 | 1.42 | 1420 | 4.0971 |
4.5315 | 1.43 | 1425 | 4.0965 |
4.5406 | 1.43 | 1430 | 4.0926 |
4.1302 | 1.44 | 1435 | 4.0872 |
4.3604 | 1.44 | 1440 | 4.0835 |
4.1604 | 1.45 | 1445 | 4.0827 |
4.8637 | 1.45 | 1450 | 4.0849 |
4.5713 | 1.46 | 1455 | 4.0861 |
4.423 | 1.46 | 1460 | 4.0831 |
4.5139 | 1.47 | 1465 | 4.0826 |
4.4847 | 1.47 | 1470 | 4.0821 |
4.9047 | 1.48 | 1475 | 4.0801 |
5.1684 | 1.48 | 1480 | 4.0776 |
4.5978 | 1.48 | 1485 | 4.0742 |
4.0684 | 1.49 | 1490 | 4.0732 |
4.7226 | 1.5 | 1495 | 4.0729 |
3.8713 | 1.5 | 1500 | 4.0713 |
4.7169 | 1.5 | 1505 | 4.0716 |
4.4524 | 1.51 | 1510 | 4.0713 |
4.2113 | 1.52 | 1515 | 4.0708 |
4.3621 | 1.52 | 1520 | 4.0700 |
4.5301 | 1.52 | 1525 | 4.0713 |
4.4511 | 1.53 | 1530 | 4.0717 |
5.0219 | 1.54 | 1535 | 4.0677 |
4.9014 | 1.54 | 1540 | 4.0648 |
4.5634 | 1.54 | 1545 | 4.0639 |
4.4578 | 1.55 | 1550 | 4.0617 |
4.1924 | 1.56 | 1555 | 4.0592 |
4.8234 | 1.56 | 1560 | 4.0593 |
4.3975 | 1.56 | 1565 | 4.0601 |
4.0672 | 1.57 | 1570 | 4.0587 |
4.6576 | 1.57 | 1575 | 4.0582 |
4.1821 | 1.58 | 1580 | 4.0586 |
4.1491 | 1.58 | 1585 | 4.0597 |
4.3562 | 1.59 | 1590 | 4.0583 |
3.8996 | 1.59 | 1595 | 4.0562 |
4.5778 | 1.6 | 1600 | 4.0550 |
4.7985 | 1.6 | 1605 | 4.0530 |
4.8654 | 1.61 | 1610 | 4.0541 |
4.7365 | 1.61 | 1615 | 4.0535 |
4.3848 | 1.62 | 1620 | 4.0517 |
4.3798 | 1.62 | 1625 | 4.0496 |
4.5424 | 1.63 | 1630 | 4.0480 |
4.2378 | 1.64 | 1635 | 4.0459 |
4.2607 | 1.64 | 1640 | 4.0442 |
4.2772 | 1.65 | 1645 | 4.0439 |
4.4935 | 1.65 | 1650 | 4.0423 |
4.5386 | 1.66 | 1655 | 4.0388 |
4.5771 | 1.66 | 1660 | 4.0367 |
3.9865 | 1.67 | 1665 | 4.0365 |
4.361 | 1.67 | 1670 | 4.0362 |
4.3416 | 1.68 | 1675 | 4.0362 |
3.8893 | 1.68 | 1680 | 4.0374 |
4.8928 | 1.69 | 1685 | 4.0376 |
4.8958 | 1.69 | 1690 | 4.0356 |
4.0317 | 1.69 | 1695 | 4.0339 |
4.663 | 1.7 | 1700 | 4.0336 |
4.6742 | 1.71 | 1705 | 4.0331 |
3.4518 | 1.71 | 1710 | 4.0328 |
4.9173 | 1.71 | 1715 | 4.0314 |
4.4265 | 1.72 | 1720 | 4.0300 |
4.542 | 1.73 | 1725 | 4.0303 |
4.7431 | 1.73 | 1730 | 4.0303 |
4.2525 | 1.73 | 1735 | 4.0296 |
4.2884 | 1.74 | 1740 | 4.0297 |
3.696 | 1.75 | 1745 | 4.0293 |
4.1032 | 1.75 | 1750 | 4.0263 |
4.1774 | 1.75 | 1755 | 4.0230 |
5.0809 | 1.76 | 1760 | 4.0238 |
3.6309 | 1.77 | 1765 | 4.0255 |
4.6119 | 1.77 | 1770 | 4.0227 |
5.0271 | 1.77 | 1775 | 4.0208 |
4.2418 | 1.78 | 1780 | 4.0198 |
4.1929 | 1.79 | 1785 | 4.0177 |
4.3941 | 1.79 | 1790 | 4.0181 |
4.6227 | 1.79 | 1795 | 4.0176 |
4.9766 | 1.8 | 1800 | 4.0155 |
4.579 | 1.81 | 1805 | 4.0144 |
4.6016 | 1.81 | 1810 | 4.0135 |
4.7758 | 1.81 | 1815 | 4.0130 |
4.0278 | 1.82 | 1820 | 4.0150 |
4.4703 | 1.82 | 1825 | 4.0141 |
4.607 | 1.83 | 1830 | 4.0122 |
4.1215 | 1.83 | 1835 | 4.0108 |
4.3157 | 1.84 | 1840 | 4.0094 |
4.0384 |
📄 许可证
本模型采用 MIT 许可证。
Phi 2 GGUF
其他
Phi-2是微软开发的一个小型但强大的语言模型,具有27亿参数,专注于高效推理和高质量文本生成。
大型语言模型 支持多种语言
P
TheBloke
41.5M
205
Roberta Large
MIT
基于掩码语言建模目标预训练的大型英语语言模型,采用改进的BERT训练方法
大型语言模型 英语
R
FacebookAI
19.4M
212
Distilbert Base Uncased
Apache-2.0
DistilBERT是BERT基础模型的蒸馏版本,在保持相近性能的同时更轻量高效,适用于序列分类、标记分类等自然语言处理任务。
大型语言模型 英语
D
distilbert
11.1M
669
Llama 3.1 8B Instruct GGUF
Meta Llama 3.1 8B Instruct 是一个多语言大语言模型,针对多语言对话用例进行了优化,在常见的行业基准测试中表现优异。
大型语言模型 英语
L
modularai
9.7M
4
Xlm Roberta Base
MIT
XLM-RoBERTa是基于100种语言的2.5TB过滤CommonCrawl数据预训练的多语言模型,采用掩码语言建模目标进行训练。
大型语言模型 支持多种语言
X
FacebookAI
9.6M
664
Roberta Base
MIT
基于Transformer架构的英语预训练模型,通过掩码语言建模目标在海量文本上训练,支持文本特征提取和下游任务微调
大型语言模型 英语
R
FacebookAI
9.3M
488
Opt 125m
其他
OPT是由Meta AI发布的开放预训练Transformer语言模型套件,参数量从1.25亿到1750亿,旨在对标GPT-3系列性能,同时促进大规模语言模型的开放研究。
大型语言模型 英语
O
facebook
6.3M
198
1
基于transformers库的预训练模型,适用于多种NLP任务
大型语言模型
Transformers

1
unslothai
6.2M
1
Llama 3.1 8B Instruct
Llama 3.1是Meta推出的多语言大语言模型系列,包含8B、70B和405B参数规模,支持8种语言和代码生成,优化了多语言对话场景。
大型语言模型
Transformers 支持多种语言

L
meta-llama
5.7M
3,898
T5 Base
Apache-2.0
T5基础版是由Google开发的文本到文本转换Transformer模型,参数规模2.2亿,支持多语言NLP任务。
大型语言模型 支持多种语言
T
google-t5
5.4M
702
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers 支持多种语言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers 英语

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统 中文
R
uer
2,694
98