bertin-base-xnli-esオープンソースモデル - スペイン語のテキスト処理、高精度な意味理解の利器！

ホーム

Bertin Base Xnli Es

bertin-projectによって開発

スペイン語RoBERTa-baseアーキテクチャに基づく事前学習モデルで、XNLIデータセットに対してファインチューニングを行い、ガウスサンプリング手法で訓練データの品質を最適化

大規模言語モデル

Transformers

スペイン語#スペイン語推論 #RoBERTaファインチューニング #XNLI適応

ダウンロード数 20

リリース時間 : 3/2/2022

モデル概要

このモデルはゼロから訓練されたスペイン語RoBERTa-baseモデルで、ガウス関数サンプリング手法で訓練データを選別し、特にXNLIタスクの性能を最適化

モデル特徴

ガウスサンプリング訓練データ

mc4データセットに対してガウス関数を用いてサブサンプリングを行い、低品質テキストや重複コンテンツを効果的にフィルタリング

512シーケンス長

最大512トークンのシーケンス処理能力をサポート

XNLI最適化

特に多言語自然言語推論タスク向けにファインチューニング

モデル能力

自然言語理解

多言語推論

テキスト分類

使用事例

自然言語処理

多言語テキスト推論

スペイン語テキスト間の論理的関係を判断

XNLIタスクで優れた性能

テキスト分類

スペイン語テキストの分類タスク

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Bertin Base Xnli Es

モデル概要

モデル特徴

モデル能力

使用事例

🚀 チェックポイント（XNLI用）

🚀 クイックスタート

👥 チームメンバー

📄 ライセンス