indo - roberta - indonli開源印尼語分類器 - 助力自然語言推理任務處理

首頁

Indo Roberta Indonli

由StevenLimcorn開發

基於Indo-roberta模型的印尼語自然語言推理分類器，使用IndoNLI數據集訓練

文本分類

Transformers

其他開源協議:MIT #印尼語NLI #零樣本推理 #遷移學習優化

下載量 34

發布時間 : 3/2/2022

模型概述

該模型是一個自然語言推理分類器，專門針對印尼語設計，能夠判斷兩個句子之間的邏輯關係（如蘊含、矛盾或中立）。

模型特點

印尼語專用

專門針對印尼語優化的自然語言推理模型

基於RoBERTa架構

使用強大的RoBERTa架構進行遷移學習

IndoNLI數據集訓練

使用專門針對印尼語的自然語言推理數據集訓練

模型能力

自然語言推理

文本分類

印尼語理解

使用案例

文本分析

事實核查

判斷兩個陳述之間是否存在邏輯矛盾

可識別文本中的矛盾信息

問答系統

評估問題與答案之間的邏輯關係

提高問答系統的準確性

🚀 Indo-roberta-indonli

Indo-roberta-indonli 是一個基於 Indo-roberta 模型的自然語言推理分類器。它在 IndoNLI 數據集上進行訓練。所使用的模型為 Indo-roberta，並通過遷移學習轉換為自然推理分類器模型。該模型使用 GitHub 倉庫中提供的驗證集、測試層數據集和專家測試數據集進行測試，結果如下所示。

✨ 主要特性

基於強大的 Indo-roberta 模型，在自然語言推理任務上表現出色。
在 IndoNLI 數據集上進行訓練，具有良好的泛化能力。

📦 安裝指南

文檔未提及安裝步驟，此處跳過。

💻 使用示例

作為自然語言推理分類器

from transformers import pipeline
pretrained_name = "StevenLimcorn/indonesian-roberta-indonli"
nlp = pipeline(
    "zero-shot-classification",
    model=pretrained_name,
    tokenizer=pretrained_name
)
nlp("Amir Sjarifoeddin Harahap lahir di Kota Medan, Sumatera Utara, 27 April 1907. Ia meninggal di Surakarta, Jawa Tengah, pada 19 Desember 1948 dalam usia 41 tahun. </s></s> Amir Sjarifoeddin Harahap masih hidup.")

📚 詳細文檔

結果

數據集	準確率	F1 值	精確率	召回率
測試層數據集	0.74329	0.74075	0.74283	0.74133
專家測試數據集	0.6115	0.60543	0.63924	0.61742

模型

該模型訓練了 5 個輪次，批次大小為 16，學習率為 2e - 5，權重衰減為 0.01。在不同輪次達到的指標如下所示。

輪次	訓練損失	驗證損失	準確率	F1 值	精確率	召回率
1	0.942500	0.658559	0.737369	0.735552	0.735488	0.736679
2	0.649200	0.645290	0.761493	0.759593	0.762784	0.759642
3	0.437100	0.667163	0.766045	0.763979	0.765740	0.763792
4	0.282000	0.786683	0.764679	0.761802	0.762011	0.761684
5	0.193500	0.925717	0.765134	0.763127	0.763560	0.763489

🔧 技術細節

文檔未提供足夠詳細的技術實現細節，此處跳過。

📄 許可證

本項目採用 MIT 許可證。

⚠️ 重要提示

需要考慮預訓練的 RoBERTa 模型和 INDONLI 數據集可能存在的偏差，這些偏差可能會影響該模型的結果。

👨‍💻 作者

Indonesian RoBERTa Base IndoNLI 由 Steven Limcorn 進行訓練和評估。所有的計算和開發工作均在 Google Colaboratory 上使用其免費 GPU 完成。

📖 參考資料

我們使用的數據集來自 IndoNLI。

@inproceedings{indonli,
    title = "IndoNLI: A Natural Language Inference Dataset for Indonesian",
    author = "Mahendra, Rahmad and Aji, Alham Fikri and Louvan, Samuel and Rahman, Fahrurrozi and Vania, Clara",
    booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2021",
    publisher = "Association for Computational Linguistics",
}