GigaBERT-v4-Arabic-and-English開源模型 - 免費部署提升英阿信息抽取零樣本遷移性能

首頁

Gigabert V4 Arabic And English

由lanwuwei開發

GigaBERT-v4是基於GigaBERT-v3在代碼混合數據上繼續預訓練的模型，在信息抽取（IE）任務中展現出從英語到阿拉伯語零樣本遷移性能的提升。

大型語言模型 #阿拉伯語-英語混合 #零樣本遷移 #信息抽取優化

下載量 24

發布時間 : 3/2/2022

模型概述

GigaBERT-v4是一個專注於英語和阿拉伯語信息抽取任務的預訓練語言模型，通過代碼混合數據增強其零樣本遷移能力。

模型特點

零樣本遷移學習

在英語到阿拉伯語的信息抽取任務中展現出優異的零樣本遷移性能。

代碼混合數據預訓練

在GigaBERT-v3基礎上使用代碼混合數據進行繼續預訓練，增強了模型的多語言處理能力。

模型能力

英語信息抽取

阿拉伯語信息抽取

跨語言零樣本遷移

使用案例

信息抽取

跨語言實體識別

在英語訓練後直接應用於阿拉伯語文本的實體識別任務

零樣本遷移性能提升

關係抽取

在英語和阿拉伯語文本中抽取實體間的關係

精選推薦AI模型

Llama 3 Typhoon V1.5x 8b Instruct

專為泰語設計的80億參數指令模型，性能媲美GPT-3.5-turbo，優化了應用場景、檢索增強生成、受限生成和推理任務

Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型，專為邊緣設備推理設計，體積僅為Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基於RoBERTa架構的中文抽取式問答模型，適用於從給定文本中提取答案的任務。

智啟未來，您的人工智能解決方案智庫

Gigabert V4 Arabic And English

模型概述

模型特點

模型能力

使用案例

🚀 GigaBERT-v4

🚀 快速開始

📦 安裝指南

💻 使用示例

基礎用法

下載鏈接