beto - gn - base - casedオープンソースのバイリンガルモデル - グアラニー語とスペイン語の自由な変換とコミュニケーションをサポート

ホーム

Beto Gn Base Cased

mmagueroによって開発

スペイン語事前学習BERTモデルを微調整したグアラニ語-スペイン語二言語モデル

大規模言語モデル

Transformers

複数言語対応オープンソースライセンス:MIT #グアラニ語-スペイン語混合 #ウィキデータ微調整 #低リソース言語処理

ダウンロード数 27

リリース時間 : 3/4/2022

モデル概要

このモデルはBETO-base-cased(スペイン語事前学習BERTモデル)を微調整した二言語モデルで、グアラニ語とスペイン語の処理をサポートします。主にテキスト分類、固有表現認識などの自然言語処理タスクに使用されます。

モデル特徴

二言語サポート

グアラニ語とスペイン語の同時処理をサポート

BERTベースの微調整

スペイン語事前学習BERTモデルを基に微調整

ウィキデータトレーニング

ウィキペディアとウィクショナリーのデータを使用してトレーニング(約80万トークン)

モデル能力

テキスト分類

固有表現認識

言語理解

空白予測

使用事例

言語研究

グアラニ語テキスト分析

グアラニ語テキスト内容の分析処理

二言語コードスイッチング研究

グアラニ語-スペイン語間のコードスイッチング現象の研究

教育応用

二言語学習ツール

グアラニ語-スペイン語二言語学習の補助

属性	详情
対応言語	gn、es
ライセンス	MIT
学習データセット	wikipedia、wiktionary
評価指標	f1、accuracy

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Beto Gn Base Cased

モデル概要

モデル特徴

モデル能力

使用事例

🚀 BETO+gn-base-cased

🚀 クイックスタート

ウィジェットの使用例

📚 ドキュメント

引用方法

📄 ライセンス