Pegasus Indian Legal
このモデルは、legal - pegasusをインドの法律データセットで微調整した法律文書要約モデルです。
ダウンロード数 104
リリース時間 : 12/8/2023
モデル概要
インドの法律文書に最適化されたPegasus要約モデルで、法律文書の簡潔な要約を生成できます。
モデル特徴
法律分野の最適化
インドの法律文書に特化して微調整されており、法律用語や構造をよりよく理解できます。
効率的な要約
長い法律文書から重要な情報を抽出し、簡潔な要約を生成できます。
モデル能力
法律文書の要約
重要情報の抽出
文書の圧縮
使用事例
法律業界
法律文書の要約
弁護士や裁判官に案件文書の要約を迅速に生成します。
法律専門家の閲読時間を節約します。
法律研究の支援
研究者が大量の法律文献を迅速に閲覧するのを支援します。
法律研究の効率を向上させます。
## 🚀 pegasus_indian_legal
このモデルは、[nsi319/legal-pegasus](https://huggingface.co/nsi319/legal-pegasus) を [ninadn/indian-legal](https://huggingface.co/datasets/ninadn/indian-legal) でファインチューニングしたバージョンです。評価セットでは以下の結果を達成しています。
- 損失: 3.8207
## 🚀 クイックスタート
このモデルは、特定の法的データセットを用いてファインチューニングされたもので、法的文書の処理などに役立ちます。
## 🔧 技術詳細
### 学習ハイパーパラメータ
学習中に使用されたハイパーパラメータは以下の通りです。
| パラメータ | 値 |
| ---- | ---- |
| learning_rate | 5e-05 |
| train_batch_size | 1 |
| eval_batch_size | 1 |
| seed | 42 |
| optimizer | Adam with betas=(0.9,0.999) and epsilon=1e-08 |
| lr_scheduler_type | linear |
| lr_scheduler_warmup_steps | 5 |
| num_epochs | 5 |
### 学習結果
| 学習損失 | エポック | ステップ | 検証損失 |
| :---: | :---: | :---: | :---: |
| 8.1139 | 0.01 | 5 | 7.1952 |
| 7.7414 | 0.01 | 10 | 6.8118 |
| 6.6586 | 0.01 | 15 | 6.6204 |
| 6.1226 | 0.02 | 20 | 6.5303 |
| 6.7833 | 0.03 | 25 | 6.4668 |
| 5.9004 | 0.03 | 30 | 6.4014 |
| 7.1037 | 0.04 | 35 | 6.3302 |
| 6.4414 | 0.04 | 40 | 6.2744 |
| 7.0245 | 0.04 | 45 | 6.2331 |
| 7.4426 | 0.05 | 50 | 6.1970 |
| 7.4032 | 0.06 | 55 | 6.1663 |
| 6.2171 | 0.06 | 60 | 6.1440 |
| 8.762 | 0.07 | 65 | 6.1259 |
| 7.9691 | 0.07 | 70 | 6.0915 |
| 7.8924 | 0.07 | 75 | 6.0554 |
| 5.6221 | 0.08 | 80 | 6.0259 |
| 6.3625 | 0.09 | 85 | 5.9976 |
| 6.7371 | 0.09 | 90 | 5.9720 |
| 6.3414 | 0.1 | 95 | 5.9505 |
| 6.1663 | 0.1 | 100 | 5.9328 |
| 5.1981 | 0.1 | 105 | 5.9121 |
| 6.8607 | 0.11 | 110 | 5.8904 |
| 6.8116 | 0.12 | 115 | 5.8700 |
| 5.9565 | 0.12 | 120 | 5.8479 |
| 5.5946 | 0.12 | 125 | 5.8239 |
| 6.856 | 0.13 | 130 | 5.7999 |
| 6.2926 | 0.14 | 135 | 5.7736 |
| 6.7472 | 0.14 | 140 | 5.7444 |
| 6.5017 | 0.14 | 145 | 5.7151 |
| 7.1512 | 0.15 | 150 | 5.6817 |
| 6.7095 | 0.15 | 155 | 5.6471 |
| 6.2288 | 0.16 | 160 | 5.6049 |
| 5.65 | 0.17 | 165 | 5.5605 |
| 5.922 | 0.17 | 170 | 5.5073 |
| 5.7808 | 0.17 | 175 | 5.4596 |
| 5.4964 | 0.18 | 180 | 5.4131 |
| 5.8934 | 0.18 | 185 | 5.3834 |
| 6.6113 | 0.19 | 190 | 5.3575 |
| 6.2676 | 0.2 | 195 | 5.3370 |
| 5.9186 | 0.2 | 200 | 5.3093 |
| 6.6886 | 0.2 | 205 | 5.2713 |
| 5.1807 | 0.21 | 210 | 5.2369 |
| 6.1971 | 0.21 | 215 | 5.2052 |
| 5.766 | 0.22 | 220 | 5.1839 |
| 5.9246 | 0.23 | 225 | 5.1648 |
| 6.4893 | 0.23 | 230 | 5.1442 |
| 5.3428 | 0.23 | 235 | 5.1130 |
| 5.7767 | 0.24 | 240 | 5.0839 |
| 5.9352 | 0.24 | 245 | 5.0620 |
| 5.6338 | 0.25 | 250 | 5.0522 |
| 5.8564 | 0.26 | 255 | 5.0327 |
| 5.7787 | 0.26 | 260 | 5.0045 |
| 5.6463 | 0.27 | 265 | 4.9912 |
| 4.9419 | 0.27 | 270 | 4.9718 |
| 6.0014 | 0.28 | 275 | 4.9586 |
| 4.8812 | 0.28 | 280 | 4.9486 |
| 5.6219 | 0.28 | 285 | 4.9317 |
| 5.4921 | 0.29 | 290 | 4.9131 |
| 5.4535 | 0.29 | 295 | 4.8967 |
| 5.1836 | 0.3 | 300 | 4.8764 |
| 4.3432 | 0.3 | 305 | 4.8662 |
| 4.8323 | 0.31 | 310 | 4.8564 |
| 4.7862 | 0.32 | 315 | 4.8482 |
| 5.3593 | 0.32 | 320 | 4.8367 |
| 5.2734 | 0.33 | 325 | 4.8283 |
| 6.5221 | 0.33 | 330 | 4.8119 |
| 5.5495 | 0.34 | 335 | 4.7992 |
| 5.2248 | 0.34 | 340 | 4.7875 |
| 6.1969 | 0.34 | 345 | 4.7771 |
| 4.9022 | 0.35 | 350 | 4.7666 |
| 5.0548 | 0.35 | 355 | 4.7528 |
| 4.1457 | 0.36 | 360 | 4.7516 |
| 5.4985 | 0.36 | 365 | 4.7376 |
| 4.7874 | 0.37 | 370 | 4.7305 |
| 5.2283 | 0.38 | 375 | 4.7214 |
| 4.4285 | 0.38 | 380 | 4.7117 |
| 5.5889 | 0.39 | 385 | 4.6993 |
| 5.0003 | 0.39 | 390 | 4.6923 |
| 6.2434 | 0.4 | 395 | 4.6796 |
| 5.4728 | 0.4 | 400 | 4.6681 |
| 4.4054 | 0.41 | 405 | 4.6598 |
| 4.6877 | 0.41 | 410 | 4.6559 |
| 4.8273 | 0.41 | 415 | 4.6557 |
| 4.8691 | 0.42 | 420 | 4.6500 |
| 5.991 | 0.42 | 425 | 4.6416 |
| 5.4251 | 0.43 | 430 | 4.6384 |
| 4.9538 | 0.43 | 435 | 4.6269 |
| 5.0589 | 0.44 | 440 | 4.6172 |
| 5.4516 | 0.45 | 445 | 4.6078 |
| 4.5009 | 0.45 | 450 | 4.6025 |
| 5.1187 | 0.46 | 455 | 4.5974 |
| 5.6275 | 0.46 | 460 | 4.5826 |
| 5.4156 | 0.47 | 465 | 4.5821 |
| 5.2567 | 0.47 | 470 | 4.5745 |
| 5.2155 | 0.47 | 475 | 4.5683 |
| 5.0582 | 0.48 | 480 | 4.5585 |
| 4.8753 | 0.48 | 485 | 4.5480 |
| 5.0787 | 0.49 | 490 | 4.5415 |
| 4.9567 | 0.49 | 495 | 4.5393 |
| 4.5857 | 0.5 | 500 | 4.5349 |
| 4.8612 | 0.51 | 505 | 4.5285 |
| 4.8277 | 0.51 | 510 | 4.5240 |
| 5.5906 | 0.52 | 515 | 4.5260 |
| 4.9499 | 0.52 | 520 | 4.5173 |
| 5.2952 | 0.53 | 525 | 4.5060 |
| 3.8274 | 0.53 | 530 | 4.4994 |
| 4.467 | 0.54 | 535 | 4.4962 |
| 5.0859 | 0.54 | 540 | 4.4934 |
| 4.3718 | 0.55 | 545 | 4.4885 |
| 4.4206 | 0.55 | 550 | 4.4825 |
| 4.5786 | 0.56 | 555 | 4.4792 |
| 4.9051 | 0.56 | 560 | 4.4704 |
| 5.2053 | 0.56 | 565 | 4.4670 |
| 4.4463 | 0.57 | 570 | 4.4657 |
| 5.7765 | 0.57 | 575 | 4.4616 |
| 4.8999 | 0.58 | 580 | 4.4641 |
| 4.6483 | 0.58 | 585 | 4.4553 |
| 5.4009 | 0.59 | 590 | 4.4444 |
| 5.1194 | 0.59 | 595 | 4.4451 |
| 4.7166 | 0.6 | 600 | 4.4393 |
| 4.8541 | 0.6 | 605 | 4.4360 |
| 4.7013 | 0.61 | 610 | 4.4320 |
| 5.4653 | 0.61 | 615 | 4.4303 |
| 5.0875 | 0.62 | 620 | 4.4255 |
| 5.1023 | 0.62 | 625 | 4.4223 |
| 4.6522 | 0.63 | 630 | 4.4194 |
| 4.8696 | 0.64 | 635 | 4.4139 |
| 5.2916 | 0.64 | 640 | 4.4094 |
| 4.8809 | 0.65 | 645 | 4.3972 |
| 5.0182 | 0.65 | 650 | 4.3930 |
| 4.9865 | 0.66 | 655 | 4.3878 |
| 4.8155 | 0.66 | 660 | 4.3860 |
| 5.5128 | 0.67 | 665 | 4.3792 |
| 5.076 | 0.67 | 670 | 4.3760 |
| 4.5312 | 0.68 | 675 | 4.3725 |
| 5.0691 | 0.68 | 680 | 4.3696 |
| 4.4553 | 0.69 | 685 | 4.3657 |
| 5.0 | 0.69 | 690 | 4.3588 |
| 4.3969 | 0.69 | 695 | 4.3574 |
| 4.7947 | 0.7 | 700 | 4.3534 |
| 5.2797 | 0.7 | 705 | 4.3471 |
| 4.3235 | 0.71 | 710 | 4.3432 |
| 4.8813 | 0.71 | 715 | 4.3424 |
| 4.4267 | 0.72 | 720 | 4.3413 |
| 4.987 | 0.72 | 725 | 4.3404 |
| 5.2805 | 0.73 | 730 | 4.3393 |
| 5.1594 | 0.73 | 735 | 4.3417 |
| 5.1164 | 0.74 | 740 | 4.3337 |
| 5.4437 | 0.74 | 745 | 4.3319 |
| 5.2844 | 0.75 | 750 | 4.3359 |
| 4.4978 | 0.76 | 755 | 4.3310 |
| 5.2737 | 0.76 | 760 | 4.3214 |
| 5.3885 | 0.77 | 765 | 4.3177 |
| 5.0851 | 0.77 | 770 | 4.3134 |
| 4.2761 | 0.78 | 775 | 4.3131 |
| 4.824 | 0.78 | 780 | 4.3051 |
| 4.5129 | 0.79 | 785 | 4.2968 |
| 4.7519 | 0.79 | 790 | 4.2943 |
| 4.4831 | 0.8 | 795 | 4.2971 |
| 4.6433 | 0.8 | 800 | 4.2932 |
| 4.4866 | 0.81 | 805 | 4.2881 |
| 4.589 | 0.81 | 810 | 4.2862 |
| 4.2021 | 0.81 | 815 | 4.2836 |
| 4.8308 | 0.82 | 820 | 4.2816 |
| 4.8649 | 0.82 | 825 | 4.2806 |
| 4.9864 | 0.83 | 830 | 4.2788 |
| 4.2605 | 0.83 | 835 | 4.2721 |
| 4.4628 | 0.84 | 840 | 4.2669 |
| 4.682 | 0.84 | 845 | 4.2690 |
| 4.3174 | 0.85 | 850 | 4.2702 |
| 4.3081 | 0.85 | 855 | 4.2675 |
| 5.0759 | 0.86 | 860 | 4.2642 |
| 4.6884 | 0.86 | 865 | 4.2619 |
| 5.1781 | 0.87 | 870 | 4.2591 |
| 4.3708 | 0.88 | 875 | 4.2581 |
| 4.5789 | 0.88 | 880 | 4.2546 |
| 5.038 | 0.89 | 885 | 4.2526 |
| 5.3472 | 0.89 | 890 | 4.2571 |
| 5.0421 | 0.9 | 895 | 4.2505 |
| 4.4187 | 0.9 | 900 | 4.2472 |
| 5.1907 | 0.91 | 905 | 4.2506 |
| 4.4268 | 0.91 | 910 | 4.2513 |
| 5.0916 | 0.92 | 915 | 4.2449 |
| 4.8503 | 0.92 | 920 | 4.2410 |
| 4.2652 | 0.93 | 925 | 4.2357 |
| 4.812 | 0.93 | 930 | 4.2317 |
| 5.084 | 0.94 | 935 | 4.2310 |
| 5.7428 | 0.94 | 940 | 4.2257 |
| 5.3298 | 0.94 | 945 | 4.2259 |
| 4.0464 | 0.95 | 950 | 4.2259 |
| 5.0414 | 0.95 | 955 | 4.2212 |
| 5.1559 | 0.96 | 960 | 4.2186 |
| 4.7129 | 0.96 | 965 | 4.2227 |
| 4.4059 | 0.97 | 970 | 4.2243 |
| 4.4548 | 0.97 | 975 | 4.2169 |
| 4.6622 | 0.98 | 980 | 4.2075 |
| 5.1651 | 0.98 | 985 | 4.2058 |
| 4.6515 | 0.99 | 990 | 4.2071 |
| 4.9588 | 0.99 | 995 | 4.2071 |
| 4.7649 | 1.0 | 1000 | 4.2091 |
| 4.7989 | 1.0 | 1005 | 4.2076 |
| 4.7028 | 1.01 | 1010 | 4.2019 |
| 5.0315 | 1.01 | 1015 | 4.1994 |
| 4.0678 | 1.02 | 1020 | 4.1973 |
| 4.1186 | 1.02 | 1025 | 4.1941 |
| 4.448 | 1.03 | 1030 | 4.1908 |
| 4.7813 | 1.03 | 1035 | 4.1892 |
| 5.0336 | 1.04 | 1040 | 4.1872 |
| 4.7727 | 1.04 | 1045 | 4.1857 |
| 4.5824 | 1.05 | 1050 | 4.1863 |
| 3.9989 | 1.05 | 1055 | 4.1859 |
| 4.5373 | 1.06 | 1060 | 4.1833 |
| 4.8955 | 1.06 | 1065 | 4.1789 |
| 4.8222 | 1.07 | 1070 | 4.1780 |
| 4.6521 | 1.07 | 1075 | 4.1790 |
| 4.1452 | 1.08 | 1080 | 4.1775 |
| 4.7654 | 1.08 | 1085 | 4.1757 |
| 4.1216 | 1.09 | 1090 | 4.1762 |
| 4.5188 | 1.09 | 1095 | 4.1720 |
| 4.8948 | 1.1 | 1100 | 4.1717 |
| 5.3199 | 1.1 | 1105 | 4.1719 |
| 4.7887 | 1.11 | 1110 | 4.1727 |
| 4.7932 | 1.11 | 1115 | 4.1692 |
| 4.1068 | 1.12 | 1120 | 4.1658 |
| 4.7401 | 1.12 | 1125 | 4.1670 |
| 4.6968 | 1.13 | 1130 | 4.1661 |
| 4.4696 | 1.14 | 1135 | 4.1646 |
| 4.2353 | 1.14 | 1140 | 4.1612 |
| 4.2536 | 1.15 | 1145 | 4.1586 |
| 4.3728 | 1.15 | 1150 | 4.1582 |
| 4.9408 | 1.16 | 1155 | 4.1550 |
| 4.6785 | 1.16 | 1160 | 4.1516 |
| 4.3829 | 1.17 | 1165 | 4.1534 |
| 4.9909 | 1.17 | 1170 | 4.1584 |
| 4.1406 | 1.18 | 1175 | 4.1584 |
| 4.9504 | 1.18 | 1180 | 4.1542 |
| 4.7331 | 1.19 | 1185 | 4.1539 |
| 5.1361 | 1.19 | 1190 | 4.1543 |
| 5.0294 | 1.2 | 1195 | 4.1492 |
| 4.595 | 1.2 | 1200 | 4.1478 |
| 4.2045 | 1.21 | 1205 | 4.1483 |
| 4.2644 | 1.21 | 1210 | 4.1491 |
| 4.3578 | 1.22 | 1215 | 4.1458 |
| 5.0108 | 1.22 | 1220 | 4.1367 |
| 4.8417 | 1.23 | 1225 | 4.1332 |
| 4.7314 | 1.23 | 1230 | 4.1334 |
| 4.38 | 1.23 | 1235 | 4.1399 |
| 4.8438 | 1.24 | 1240 | 4.1350 |
| 4.4486 | 1.25 | 1245 | 4.1304 |
| 4.2011 | 1.25 | 1250 | 4.1297 |
| 5.0078 | 1.25 | 1255 | 4.1320 |
| 4.9064 | 1.26 | 1260 | 4.1347 |
| 4.8337 | 1.27 | 1265 | 4.1331 |
| 4.5072 | 1.27 | 1270 | 4.1288 |
| 5.1174 | 1.27 | 1275 | 4.1259 |
| 4.9408 | 1.28 | 1280 | 4.1269 |
| 4.3618 | 1.28 | 1285 | 4.1325 |
| 4.4125 | 1.29 | 1290 | 4.1313 |
| 4.5327 | 1.29 | 1295 | 4.1215 |
| 4.9565 | 1.3 | 1300 | 4.1188 |
| 4.5604 | 1.3 | 1305 | 4.1207 |
| 4.8142 | 1.31 | 1310 | 4.1203 |
| 4.2889 | 1.31 | 1315 | 4.1161 |
| 5.1939 | 1.32 | 1320 | 4.1131 |
| 4.945 | 1.32 | 1325 | 4.1114 |
| 4.1199 | 1.33 | 1330 | 4.1099 |
| 4.7964 | 1.33 | 1335 | 4.1061 |
| 4.3781 | 1.34 | 1340 | 4.1028 |
| 4.9565 | 1.34 | 1345 | 4.1014 |
| 5.3126 | 1.35 | 1350 | 4.1021 |
| 4.5448 | 1.35 | 1355 | 4.1016 |
| 4.3571 | 1.36 | 1360 | 4.1007 |
| 4.326 | 1.36 | 1365 | 4.0991 |
| 4.4253 | 1.37 | 1370 | 4.0985 |
| 4.5005 | 1.38 | 1375 | 4.1032 |
| 4.6244 | 1.38 | 1380 | 4.1051 |
| 3.8342 | 1.39 | 1385 | 4.1015 |
| 4.0543 | 1.39 | 1390 | 4.0978 |
| 4.6442 | 1.4 | 1395 | 4.0983 |
| 4.3291 | 1.4 | 1400 | 4.0963 |
| 4.5691 | 1.41 | 1405 | 4.0945 |
| 4.9671 | 1.41 | 1410 | 4.0954 |
| 4.5716 | 1.42 | 1415 | 4.0972 |
| 3.902 | 1.42 | 1420 | 4.0971 |
| 4.5315 | 1.43 | 1425 | 4.0965 |
| 4.5406 | 1.43 | 1430 | 4.0926 |
| 4.1302 | 1.44 | 1435 | 4.0872 |
| 4.3604 | 1.44 | 1440 | 4.0835 |
| 4.1604 | 1.45 | 1445 | 4.0827 |
| 4.8637 | 1.45 | 1450 | 4.0849 |
| 4.5713 | 1.46 | 1455 | 4.0861 |
| 4.423 | 1.46 | 1460 | 4.0831 |
| 4.5139 | 1.47 | 1465 | 4.0826 |
| 4.4847 | 1.47 | 1470 | 4.0821 |
| 4.9047 | 1.48 | 1475 | 4.0801 |
| 5.1684 | 1.48 | 1480 | 4.0776 |
| 4.5978 | 1.48 | 1485 | 4.0742 |
| 4.0684 | 1.49 | 1490 | 4.0732 |
| 4.7226 | 1.5 | 1495 | 4.0729 |
| 3.8713 | 1.5 | 1500 | 4.0713 |
| 4.7169 | 1.5 | 1505 | 4.0716 |
| 4.4524 | 1.51 | 1510 | 4.0713 |
| 4.2113 | 1.52 | 1515 | 4.0708 |
| 4.3621 | 1.52 | 1520 | 4.0700 |
| 4.5301 | 1.52 | 1525 | 4.0713 |
| 4.4511 | 1.53 | 1530 | 4.0717 |
| 5.0219 | 1.54 | 1535 | 4.0677 |
| 4.9014 | 1.54 | 1540 | 4.0648 |
| 4.5634 | 1.54 | 1545 | 4.0639 |
| 4.4578 | 1.55 | 1550 | 4.0617 |
| 4.1924 | 1.56 | 1555 | 4.0592 |
| 4.8234 | 1.56 | 1560 | 4.0593 |
| 4.3975 | 1.56 | 1565 | 4.0601 |
| 4.0672 | 1.57 | 1570 | 4.0587 |
| 4.6576 | 1.57 | 1575 | 4.0582 |
| 4.1821 | 1.58 | 1580 | 4.0586 |
| 4.1491 | 1.58 | 1585 | 4.0597 |
| 4.3562 | 1.59 | 1590 | 4.0583 |
| 3.8996 | 1.59 | 1595 | 4.0562 |
| 4.5778 | 1.6 | 1600 | 4.0550 |
| 4.7985 | 1.6 | 1605 | 4.0530 |
| 4.8654 | 1.61 | 1610 | 4.0541 |
| 4.7365 | 1.61 | 1615 | 4.0535 |
| 4.3848 | 1.62 | 1620 | 4.0517 |
| 4.3798 | 1.62 | 1625 | 4.0496 |
| 4.5424 | 1.63 | 1630 | 4.0480 |
| 4.2378 | 1.64 | 1635 | 4.0459 |
| 4.2607 | 1.64 | 1640 | 4.0442 |
| 4.2772 | 1.65 | 1645 | 4.0439 |
| 4.4935 | 1.65 | 1650 | 4.0423 |
| 4.5386 | 1.66 | 1655 | 4.0388 |
| 4.5771 | 1.66 | 1660 | 4.0367 |
| 3.9865 | 1.67 | 1665 | 4.0365 |
| 4.361 | 1.67 | 1670 | 4.0362 |
| 4.3416 | 1.68 | 1675 | 4.0362 |
| 3.8893 | 1.68 | 1680 | 4.0374 |
| 4.8928 | 1.69 | 1685 | 4.0376 |
| 4.8958 | 1.69 | 1690 | 4.0356 |
| 4.0317 | 1.69 | 1695 | 4.0339 |
| 4.663 | 1.7 | 1700 | 4.0336 |
| 4.6742 | 1.71 | 1705 | 4.0331 |
| 3.4518 | 1.71 | 1710 | 4.0328 |
| 4.9173 | 1.71 | 1715 | 4.0314 |
| 4.4265 | 1.72 | 1720 | 4.0300 |
| 4.542 | 1.73 | 1725 | 4.0303 |
| 4.7431 | 1.73 | 1730 | 4.0303 |
| 4.2525 | 1.73 | 1735 | 4.0296 |
| 4.2884 | 1.74 | 1740 | 4.0297 |
| 3.696 | 1.75 | 1745 | 4.0293 |
| 4.1032 | 1.75 | 1750 | 4.0263 |
| 4.1774 | 1.75 | 1755 | 4.0230 |
| 5.0809 | 1.76 | 1760 | 4.0238 |
| 3.6309 | 1.77 | 1765 | 4.0255 |
| 4.6119 | 1.77 | 1770 | 4.0227 |
| 5.0271 | 1.77 | 1775 | 4.0208 |
| 4.2418 | 1.78 | 1780 | 4.0198 |
| 4.1929 | 1.79 | 1785 | 4.0177 |
| 4.3941 | 1.79 | 1790 | 4.0181 |
| 4.6227 | 1.79 | 1795 | 4.0176 |
| 4.9766 | 1.8 | 1800 | 4.0155 |
| 4.579 | 1.81 | 1805 | 4.0144 |
| 4.6016 | 1.81 | 1810 | 4.0135 |
| 4.7758 | 1.81 | 1815 | 4.0130 |
| 4.0278 | 1.82 | 1820 | 4.0150 |
| 4.4703 | 1.82 | 1825 | 4.0141 |
| 4.607 | 1.83 | 1830 | 4.0122 |
| 4.1215 | 1.83 | 1835 | 4.0108 |
| 4.3157 | 1.84 | 1840 | 4.0094 |
| 4.0384 | 0.54 | 540 | 4.4934 |
| 4.3718 | 0.55 | 545 | 4.4885 |
| 4.4206 | 0.55 | 550 | 4.4825 |
| 4.5786 | 0.56 | 555 | 4.4792 |
| 4.9051 | 0.56 | 560 | 4.4704 |
| 5.2053 | 0.56 | 565 | 4.4670 |
| 4.4463 | 0.57 | 570 | 4.4657 |
| 5.7765 | 0.57 | 575 | 4.4616 |
| 4.8999 | 0.58 | 580 | 4.4641 |
| 4.6483 | 0.58 | 585 | 4.4553 |
| 5.4009 | 0.59 | 590 | 4.4444 |
| 5.1194 | 0.59 | 595 | 4.4451 |
| 4.7166 | 0.6 | 600 | 4.4393 |
| 4.8541 | 0.6 | 605 | 4.4360 |
| 4.7013 | 0.61 | 610 | 4.4320 |
| 5.4653 | 0.61 | 615 | 4.4303 |
| 5.0875 | 0.62 | 620 | 4.4255 |
| 5.1023 | 0.62 | 625 | 4.4223 |
| 4.6522 | 0.63 | 630 | 4.4194 |
| 4.8696 | 0.64 | 635 | 4.4139 |
| 5.2916 | 0.64 | 640 | 4.4094 |
| 4.8809 | 0.65 | 645 | 4.3972 |
| 5.0182 | 0.65 | 650 | 4.3930 |
| 4.9865 | 0.66 | 655 | 4.3878 |
| 4.8155 | 0.66 | 660 | 4.3860 |
| 5.5128 | 0.67 | 665 | 4.3792 |
| 5.076 | 0.67 | 670 | 4.3760 |
| 4.5312 | 0.68 | 675 | 4.3725 |
| 5.0691 | 0.68 | 680 | 4.3696 |
| 4.4553 | 0.69 | 685 | 4.3657 |
| 5.0 | 0.69 | 690 | 4.3588 |
| 4.3969 | 0.69 | 695 | 4.3574 |
| 4.7947 | 0.7 | 700 | 4.3534 |
| 5.2797 | 0.7 | 705 | 4.3471 |
| 4.3235 | 0.71 | 710 | 4.3432 |
| 4.8813 | 0.71 | 715 | 4.3424 |
| 4.4267 | 0.72 | 720 | 4.3413 |
| 4.987 | 0.72 | 725 | 4.3404 |
| 5.2805 | 0.73 | 730 | 4.3393 |
| 5.1594 | 0.73 | 735 | 4.3417 |
| 5.1164 | 0.74 | 740 | 4.3337 |
| 5.4437 | 0.74 | 745 | 4.3319 |
| 5.2844 | 0.75 | 750 | 4.3359 |
| 4.4978 | 0.76 | 755 | 4.3310 |
| 5.2737 | 0.76 | 760 | 4.3214 |
| 5.3885 | 0.77 | 765 | 4.3177 |
| 5.0851 | 0.77 | 770 | 4.3134 |
| 4.2761 | 0.78 | 775 | 4.3131 |
| 4.824 | 0.78 | 780 | 4.3051 |
| 4.5129 | 0.79 | 785 | 4.2968 |
| 4.7519 | 0.79 | 790 | 4.2943 |
| 4.4831 | 0.8 | 795 | 4.2971 |
| 4.6433 | 0.8 | 800 | 4.2932 |
| 4.4866 | 0.81 | 805 | 4.2881 |
| 4.589 | 0.81 | 810 | 4.2862 |
| 4.2021 | 0.81 | 815 | 4.2836 |
| 4.8308 | 0.82 | 820 | 4.2816 |
| 4.8649 | 0.82 | 825 | 4.2806 |
| 4.9864 | 0.83 | 830 | 4.2788 |
| 4.2605 | 0.83 | 835 | 4.2721 |
| 4.4628 | 0.84 | 840 | 4.2669 |
| 4.682 | 0.84 | 845 | 4.2690 |
| 4.3174 | 0.85 | 850 | 4.2702 |
| 4.3081 | 0.85 | 855 | 4.2675 |
| 5.0759 | 0.86 | 860 | 4.2642 |
| 4.6884 | 0.86 | 865 | 4.2619 |
| 5.1781 | 0.87 | 870 | 4.2591 |
| 4.3708 | 0.88 | 875 | 4.2581 |
| 4.5789 | 0.88 | 880 | 4.2546 |
| 5.038 | 0.89 | 885 | 4.2526 |
| 5.3472 | 0.89 | 890 | 4.2571 |
| 5.0421 | 0.9 | 895 | 4.2505 |
| 4.4187 | 0.9 | 900 | 4.2472 |
| 5.1907 | 0.91 | 905 | 4.2506 |
| 4.4268 | 0.91 | 910 | 4.2513 |
| 5.0916 | 0.92 | 915 | 4.2449 |
| 4.8503 | 0.92 | 920 | 4.2410 |
| 4.2652 | 0.93 | 925 | 4.2357 |
| 4.812 | 0.93 | 930 | 4.2317 |
| 5.084 | 0.94 | 935 | 4.2310 |
| 5.7428 | 0.94 | 940 | 4.2257 |
| 5.3298 | 0.94 | 945 | 4.2259 |
| 4.0464 | 0.95 | 950 | 4.2259 |
| 5.0414 | 0.95 | 955 | 4.2212 |
| 5.1559 | 0.96 | 960 | 4.2186 |
| 4.7129 | 0.96 | 965 | 4.2227 |
| 4.4059 | 0.97 | 970 | 4.2243 |
| 4.4548 | 0.97 | 975 | 4.2169 |
| 4.6622 | 0.98 | 980 | 4.2075 |
| 5.1651 | 0.98 | 985 | 4.2058 |
| 4.6515 | 0.99 | 990 | 4.2071 |
| 4.9588 | 0.99 | 995 | 4.2071 |
| 4.7649 | 1.0 | 1000 | 4.2091 |
| 4.7989 | 1.0 | 1005 | 4.2076 |
| 4.7028 | 1.01 | 1010 | 4.2019 |
| 5.0315 | 1.01 | 1015 | 4.1994 |
| 4.0678 | 1.02 | 1020 | 4.1973 |
| 4.1186 | 1.02 | 1025 | 4.1941 |
| 4.448 | 1.03 | 1030 | 4.1908 |
| 4.7813 | 1.03 | 1035 | 4.1892 |
| 5.0336 | 1.04 | 1040 | 4.1872 |
| 4.7727 | 1.04 | 1045 | 4.1857 |
| 4.5824 | 1.05 | 1050 | 4.1863 |
| 3.9989 | 1.05 | 1055 | 4.1859 |
| 4.5373 | 1.06 | 1060 | 4.1833 |
| 4.8955 | 1.06 | 1065 | 4.1789 |
| 4.8222 | 1.07 | 1070 | 4.1780 |
| 4.6521 | 1.07 | 1075 | 4.1790 |
| 4.1452 | 1.08 | 1080 | 4.1775 |
| 4.7654 | 1.08 | 1085 | 4.1757 |
| 4.1216 | 1.09 | 1090 | 4.1762 |
| 4.5188 | 1.09 | 1095 | 4.1720 |
| 4.8948 | 1.1 | 1100 | 4.1717 |
| 5.3199 | 1.1 | 1105 | 4.1719 |
| 4.7887 | 1.11 | 1110 | 4.1727 |
| 4.7932 | 1.11 | 1115 | 4.1692 |
| 4.1068 | 1.12 | 1120 | 4.1658 |
| 4.7401 | 1.12 | 1125 | 4.1670 |
| 4.6968 | 1.13 | 1130 | 4.1661 |
| 4.4696 | 1.14 | 1135 | 4.1646 |
| 4.2353 | 1.14 | 1140 | 4.1612 |
| 4.2536 | 1.15 | 1145 | 4.1586 |
| 4.3728 | 1.15 | 1150 | 4.1582 |
| 4.9408 | 1.16 | 1155 | 4.1550 |
| 4.6785 | 1.16 | 1160 | 4.1516 |
| 4.3829 | 1.17 | 1165 | 4.1534 |
| 4.9909 | 1.17 | 1170 | 4.1584 |
| 4.1406 | 1.18 | 1175 | 4.1584 |
| 4.9504 | 1.18 | 1180 | 4.1542 |
| 4.7331 | 1.19 | 1185 | 4.1539 |
| 5.1361 | 1.19 | 1190 | 4.1543 |
| 5.0294 | 1.2 | 1195 | 4.1492 |
| 4.595 | 1.2 | 1200 | 4.1478 |
| 4.2045 | 1.21 | 1205 | 4.1483 |
| 4.2644 | 1.21 | 1210 | 4.1491 |
| 4.3578 | 1.22 | 1215 | 4.1458 |
| 5.0108 | 1.22 | 1220 | 4.1367 |
| 4.8417 | 1.23 | 1225 | 4.1332 |
| 4.7314 | 1.23 | 1230 | 4.1334 |
| 4.38 | 1.23 | 1235 | 4.1399 |
| 4.8438 | 1.24 | 1240 | 4.1350 |
| 4.4486 | 1.25 | 1245 | 4.1304 |
| 4.2011 | 1.25 | 1250 | 4.1297 |
| 5.0078 | 1.25 | 1255 | 4.1320 |
| 4.9064 | 1.26 | 1260 | 4.1347 |
| 4.8337 | 1.27 | 1265 | 4.1331 |
| 4.5072 | 1.27 | 1270 | 4.1288 |
| 5.1174 | 1.27 | 1275 | 4.1259 |
| 4.9408 | 1.28 | 1280 | 4.1269 |
| 4.3618 | 1.28 | 1285 | 4.1325 |
| 4.4125 | 1.29 | 1290 | 4.1313 |
| 4.5327 | 1.29 | 1295 | 4.1215 |
| 4.9565 | 1.3 | 1300 | 4.1188 |
| 4.5604 | 1.3 | 1305 | 4.1207 |
| 4.8142 | 1.31 | 1310 | 4.1203 |
| 4.2889 | 1.31 | 1315 | 4.1161 |
| 5.1939 | 1.32 | 1320 | 4.1131 |
| 4.945 | 1.32 | 1325 | 4.1114 |
| 4.1199 | 1.33 | 1330 | 4.1099 |
| 4.7964 | 1.33 | 1335 | 4.1061 |
| 4.3781 | 1.34 | 1340 | 4.1028 |
| 4.9565 | 1.34 | 1345 | 4.1014 |
| 5.3126 | 1.35 | 1350 | 4.1021 |
| 4.5448 | 1.35 | 1355 | 4.1016 |
Phi 2 GGUF
その他
Phi-2はマイクロソフトが開発した小型ながら強力な言語モデルで、27億のパラメータを持ち、効率的な推論と高品質なテキスト生成に特化しています。
大規模言語モデル 複数言語対応
P
TheBloke
41.5M
205
Roberta Large
MIT
マスク言語モデリングの目標で事前学習された大型英語言語モデルで、改良されたBERTの学習方法を採用しています。
大規模言語モデル 英語
R
FacebookAI
19.4M
212
Distilbert Base Uncased
Apache-2.0
DistilBERTはBERT基礎モデルの蒸留バージョンで、同等の性能を維持しながら、より軽量で高効率です。シーケンス分類、タグ分類などの自然言語処理タスクに適しています。
大規模言語モデル 英語
D
distilbert
11.1M
669
Llama 3.1 8B Instruct GGUF
Meta Llama 3.1 8B Instructは多言語大規模言語モデルで、多言語対話ユースケースに最適化されており、一般的な業界ベンチマークで優れた性能を発揮します。
大規模言語モデル 英語
L
modularai
9.7M
4
Xlm Roberta Base
MIT
XLM - RoBERTaは、100言語の2.5TBのフィルタリングされたCommonCrawlデータを使って事前学習された多言語モデルで、マスク言語モデリングの目標で学習されています。
大規模言語モデル 複数言語対応
X
FacebookAI
9.6M
664
Roberta Base
MIT
Transformerアーキテクチャに基づく英語の事前学習モデルで、マスク言語モデリングの目標を通じて大量のテキストでトレーニングされ、テキスト特徴抽出と下流タスクの微調整をサポートします。
大規模言語モデル 英語
R
FacebookAI
9.3M
488
Opt 125m
その他
OPTはMeta AIが公開したオープンプリトレーニングトランスフォーマー言語モデルスイートで、パラメータ数は1.25億から1750億まであり、GPT-3シリーズの性能に対抗することを目指しつつ、大規模言語モデルのオープンな研究を促進するものです。
大規模言語モデル 英語
O
facebook
6.3M
198
1
transformersライブラリに基づく事前学習モデルで、様々なNLPタスクに適用可能
大規模言語モデル
Transformers

1
unslothai
6.2M
1
Llama 3.1 8B Instruct
Llama 3.1はMetaが発表した多言語大規模言語モデルシリーズで、8B、70B、405Bのパラメータ規模を持ち、8種類の言語とコード生成をサポートし、多言語対話シーンを最適化しています。
大規模言語モデル
Transformers 複数言語対応

L
meta-llama
5.7M
3,898
T5 Base
Apache-2.0
T5ベーシック版はGoogleによって開発されたテキスト-to-テキスト変換Transformerモデルで、パラメータ規模は2.2億で、多言語NLPタスクをサポートしています。
大規模言語モデル 複数言語対応
T
google-t5
5.4M
702
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98