wangchanberta-base-att-spm-uncased-finetune-qa開源泰語問答系統

首頁

Wangchanberta Base Att Spm Uncased Finetune Qa

由cstorm125開發

基於WangchanBERTa模型微調的泰語問答系統，使用多個泰語QA數據集進行訓練

問答系統

Transformers

#泰語問答系統 #教育領域QA #短文本理解

下載量 30

發布時間 : 3/2/2022

模型概述

這是一個專門針對泰語問答任務優化的BERT模型變體，通過微調提升了在泰語問答場景下的性能

模型特點

泰語優化

專門針對泰語特性進行優化的BERT模型變體

多數據集微調

使用iapp_wiki_qa_squad、thaiqa_squad和nsc_qa多個泰語QA數據集進行訓練

數據篩選

訓練時移除了與驗證集和測試集餘弦相似度超過0.8的樣本，提高泛化能力

上下文優化

對部分數據集的上下文進行了裁剪，優化模型處理能力

模型能力

泰語閱讀理解

泰語問答生成

泰語文本理解

使用案例

教育

泰語學習輔助

幫助學生理解泰語文本並回答問題

信息檢索

泰語文檔問答

從泰語文檔中提取信息並生成答案

🚀 airesearch/wangchanberta-base-att-spm-uncased

airesearch/wangchanberta-base-att-spm-uncased 這個模型使用了 iapp_wiki_qa_squad、thaiqa_squad 和 nsc_qa 的訓練集進行微調。其中，移除了與驗證集和測試集餘弦相似度超過 0.8 的示例，並且後兩個數據集的上下文被修剪至約 300 個 newmm 詞。使用 iapp_wiki_qa_squad 的驗證集和測試集在 wandb 上進行了基準測試。

該模型使用 thai2transformers 進行訓練。

🚀 快速開始

運行命令

export MODEL_NAME=airesearch/wangchanberta-base-att-spm-uncased
python train_question_answering_lm_finetuning.py \
  --model_name $MODEL_NAME \
  --dataset_name chimera_qa \
  --output_dir $MODEL_NAME-finetune-chimera_qa-model \
  --log_dir $MODEL_NAME-finetune-chimera_qa-log \
  --lowercase \
  --pad_on_right \
  --fp16

💻 使用示例

基礎用法

# 定義模型名稱
export MODEL_NAME=airesearch/wangchanberta-base-att-spm-uncased
# 運行訓練腳本
python train_question_answering_lm_finetuning.py \
  --model_name $MODEL_NAME \
  --dataset_name chimera_qa \
  --output_dir $MODEL_NAME-finetune-chimera_qa-model \
  --log_dir $MODEL_NAME-finetune-chimera_qa-log \
  --lowercase \
  --pad_on_right \
  --fp16

高級用法

# 可以根據實際需求調整其他參數，例如修改學習率、批次大小等
export MODEL_NAME=airesearch/wangchanberta-base-att-spm-uncased
python train_question_answering_lm_finetuning.py \
  --model_name $MODEL_NAME \
  --dataset_name chimera_qa \
  --output_dir $MODEL_NAME-finetune-chimera_qa-model \
  --log_dir $MODEL_NAME-finetune-chimera_qa-log \
  --lowercase \
  --pad_on_right \
  --fp16 \
  --learning_rate 1e-5 \
  --per_device_train_batch_size 16

補充信息

問題與上下文示例

屬性	詳情
問題	สวนกุหลาบเป็นโรงเรียนอะไร
上下文	玫瑰園學校（Suankularb Wittayalai School）（縮寫：S.K.）是一所全男子的大型特殊中學，隸屬於基礎教育委員會辦公室（原：普通教育廳）中學教育區域辦公室 1，由拉瑪五世朱拉隆功大帝創立，於佛曆 2424 年 3 月 8 日建成（當時以 4 月 1 日為新年，按國際計算為佛曆 2425 年），是泰國第一所公立學校。