Berdou_200kオープンソースポルトガル語BERTモデル - 公式公报データに基づくテキスト処理の最適化

ホーム

Berdou 200k

flavio-nakasatoによって開発

Bertimbau-Baseモデルをブラジル連邦官報の20万件の事例でMLM（マスク言語モデリング）を用いて微調整したポルトガル語のBERTモデル

大規模言語モデル

Transformers

#ポルトガル語MLM #ブラジルの法律テキスト #連邦官報の微調整

ダウンロード数 17

リリース時間 : 3/2/2022

モデル概要

ブラジルの法律や政府公文書に特化して最適化された事前学習言語モデルで、ポルトガル語のテキスト理解タスクに適しています。

モデル特徴

法律分野の最適化

ブラジル連邦官報のデータで微調整されており、法律や政府公文書の用語をより良く理解できます。

ポルトガル語の特化

ブラジルのポルトガル語バリエーションに対して事前学習と微調整が行われています。

効率的な微調整の基礎

広く使われているBERTアーキテクチャに基づいており、下流タスクの転移学習が容易です。

モデル能力

テキスト理解

法律テキスト分析

政府公文書処理

固有表現認識

テキスト分類

使用事例

法律テクノロジー

法律文書の自動分類

ブラジルの法律文書を自動的に分類してアーカイブします。

法律文書の処理効率を向上させます。

契約条項の分析

契約書から重要な条項を識別して抽出します。

契約書の審査プロセスを加速します。

政府アプリケーション

官報情報の抽出

連邦官報から構造化された情報を抽出します。

政府の情報公開の効率を向上させます。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Berdou 200k

モデル概要

モデル特徴

モデル能力

使用事例

🚀 Bertimbau-BaseモデルからのMLM微調整

🚀 クイックスタート

✨ 主な機能

📦 インストール

💻 使用例

📚 ドキュメント

🔧 技術詳細

📄 ライセンス