Mistral-portuguese-luana-7bオープンソースモデル - ポルトガル語モデルの空白を埋め、命令対話をよりインテリジェントに

ホーム

Mistral Portuguese Luana 7b

rhaymisonによって開発

Mistral-7Bをファインチューニングしたポルトガル語コマンド最適化モデル。20万件のポルトガル語コマンドで訓練され、ポルトガル語モデルの空白を埋める

大規模言語モデル

Transformers

その他オープンソースライセンス:Apache-2.0 #ポルトガル語コマンド最適化 #教育試験補助 #小型モデル効率推論

ダウンロード数 59

リリース時間 : 4/1/2024

モデル概要

このモデルはポルトガル語に最適化されたコマンド追従モデルで、Mistral 7Bアーキテクチャを基にファインチューニングされており、特にポルトガル語の理解と生成能力が最適化されており、様々なテキスト生成タスクに適している

モデル特徴

ポルトガル語最適化

ポルトガル語に特化してファインチューニングされ、20万件のポルトガル語コマンドで訓練されている

コマンド追従

コマンドの理解と実行能力が最適化されており、タスク指向型の対話に特に適している

マルチ量子化サポート

完全モデルから4ビット量子化まで複数のバージョンを提供し、様々なハードウェア要件に対応

LangChain統合

LangChainフレームワークとの統合をサポートし、複雑なアプリケーション構築を容易にする

モデル能力

ポルトガル語テキスト生成

コマンド理解と実行

質問応答システム

教育コンテンツ生成

法律テキスト処理

感情分析

使用事例

教育

数学説明

2+2=4などの数学的概念を説明

教育に適した説明内容を生成可能

ENEM試験補助

ブラジル国家中等教育試験(ENEM)関連の質問に回答

ENEMチャレンジで58.64%の精度を達成

法律

OAB試験補助

ブラジル弁護士資格試験(OAB)関連の質問を処理

OAB試験データセットで38.82%の精度を達成

感情分析

ヘイトスピーチ検出

ポルトガル語のヘイトスピーチを識別

HateBRデータセットで77.24%のマクロF1値を達成

ツイート感情分析

ポルトガル語ツイートの感情傾向を分析

tweetSentBRデータセットで63.0%のマクロF1値を達成

🚀 Mistral-portuguese-luana-7b

このモデルは、ポルトガル語で20万件の命令のスーパーセットを使用してトレーニングされました。ポルトガル語のモデルにおけるギャップを埋めることを目的としています。Mistral 7bから微調整され、主に命令型のタスクに合わせて調整されています。

もし拡張互換性を求めている場合、LuanaモデルにはLlamaCppで実行できるGGUFファミリーもあります。以下のモデルからGGUFモデルを探索できます。

このモデルや他のモデルを探索して、あなたのニーズに最適なものを見つけてください！

🚀 クイックスタート

完全モデル : A100

半分モデル: L4

8ビットまたは4ビット : T4またはV100

このモデルは、通常の形式から4ビット量子化まで使用できます。以下では、両方のアプローチを使用します。プロンプトで動詞が重要であることを忘れないでください。モデルにどのように行動するかを指示することで、応答の質を向上させることができます。このような重要なポイントは、7bのような小さなモデルでも性能を大幅に向上させます。

!pip install -q -U transformers
!pip install -q -U accelerate
!pip install -q -U bitsandbytes

from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
model = AutoModelForCausalLM.from_pretrained("rhaymison/Mistral-portuguese-luana-7b", device_map= {"": 0})
tokenizer = AutoTokenizer.from_pretrained("rhaymison/Mistral-portuguese-luana-7b")
model.eval()

パイプラインを使用することもできますが、この例ではストリーミングを使用します。


inputs = tokenizer([f"""<s>[INST] Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto.
Escreva uma resposta que complete adequadamente o pedido.
### instrução: aja como um professor de matemática e me explique porque 2 + 2 = 4.
[/INST]"""], return_tensors="pt")

inputs.to(model.device)

streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
_ = model.generate(**inputs, streamer=streamer, max_new_tokens=200)

"CUDA Out of memory"のようなメモリの問題が発生した場合は、4ビットまたは8ビット量子化を使用する必要があります。コラボで完全なモデルを使用するには、A100が必要です。4ビットまたは8ビットを使用する場合は、T4またはL4で問題を解決できます。

💻 使用例

基本的な使用法

from transformers import AutoModelForCausalLM, AutoTokenizer, TextStreamer
model = AutoModelForCausalLM.from_pretrained("rhaymison/Mistral-portuguese-luana-7b", device_map= {"": 0})
tokenizer = AutoTokenizer.from_pretrained("rhaymison/Mistral-portuguese-luana-7b")
model.eval()

inputs = tokenizer([f"""<s>[INST] Abaixo está uma instrução que descreve uma tarefa, juntamente com uma entrada que fornece mais contexto.
Escreva uma resposta que complete adequadamente o pedido.
### instrução: aja como um professor de matemática e me explique porque 2 + 2 = 4.
[/INST]"""], return_tensors="pt")

inputs.to(model.device)

streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
_ = model.generate(**inputs, streamer=streamer, max_new_tokens=200)

高度な使用法

4ビット量子化の例

from transformers import BitsAndBytesConfig
import torch
nb_4bit_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16,
    bnb_4bit_use_double_quant=True
)

model = AutoModelForCausalLM.from_pretrained(
    base_model,
    quantization_config=bnb_config,
    device_map={"": 0}
)

📚 ドキュメント

Open Portuguese LLM Leaderboard Evaluation Results

詳細な結果はこちらで確認できます。

指標	値
平均	64.27
ENEM Challenge (No Images)	58.64
BLUEX (No Images)	47.98
OAB Exams	38.82
Assin2 RTE	90.63
Assin2 STS	75.81
FaQuAD NLI	57.79
HateBR Binary	77.24
PT Hate Speech Binary	68.50
tweetSentBR	63