GigaBERT-v3开源双语模型 - 支持英阿语信息抽取，免费又实用！

首页

Gigabert V3 Arabic And English

由 lanwuwei 开发

GigaBERT-v3是针对英语和阿拉伯语定制的双语BERT模型，基于大规模语料库预训练，在信息抽取任务中表现优异。

大型语言模型支持多种语言#英阿双语处理 #零样本迁移 #信息抽取优化

下载量 38

发布时间 : 3/2/2022

模型简介

GigaBERT-v3是一个专门针对英语和阿拉伯语的双语BERT模型，通过大规模语料库预训练，在信息抽取任务中实现了英语到阿拉伯语的零样本迁移最优性能。

模型特点

双语支持

专门针对英语和阿拉伯语的双语模型，支持两种语言的信息处理。

大规模预训练

基于约100亿词符的大规模语料库（Gigaword+Oscar+Wikipedia）进行预训练。

零样本迁移

在信息抽取任务中实现了英语到阿拉伯语的零样本迁移最优性能。

模型能力

信息抽取

文本分类

命名实体识别

使用案例

自然语言处理

跨语言信息抽取

从英语和阿拉伯语文本中提取关键信息。

实现英语到阿拉伯语的零样本迁移最优性能。

属性	详情
支持语言	英语、阿拉伯语、多语言
训练数据集	Gigaword、Oscar、Wikipedia

精选推荐AI模型

Llama 3 Typhoon V1.5x 8b Instruct

专为泰语设计的80亿参数指令模型，性能媲美GPT-3.5-turbo，优化了应用场景、检索增强生成、受限生成和推理任务

Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型，专为边缘设备推理设计，体积仅为Cosmo-3B模型的2%左右。

Roberta Base Chinese Extractive Qa

基于RoBERTa架构的中文抽取式问答模型，适用于从给定文本中提取答案的任务。

智启未来，您的人工智能解决方案智库

Gigabert V3 Arabic And English

模型简介

模型特点

模型能力

使用案例

🚀 GigaBERT-v3

🚀 快速开始

📦 安装指南

💻 使用示例

基础用法

📚 详细文档