🚀 センテンストランスフォーマーモデル
このモデルは、文章や段落を768次元の密ベクトル空間にマッピングし、クラスタリングや意味検索などのタスクに使用できるセンテンストランスフォーマーモデルです。
🚀 クイックスタート
sentence-transformers
をインストールすると、このモデルの使用が簡単になります。
pip install -U sentence-transformers
その後、以下のようにモデルを使用できます。
from sentence_transformers import SentenceTransformer, util
model = SentenceTransformer('dariolopez/roberta-base-bne-finetuned-msmarco-qa-es-mnrl-mn')
corpus = [
"Napoleón I Bonaparte (Ajaccio, 15 de agosto de 1769-Longwood, 5 de mayo de 1821) fue un militar y estadista francés, general republicano durante la Revolución francesa y el Directorio, y artífice del golpe de Estado del 18 de brumario que lo convirtió en primer cónsul (Premier Consul) de la República el 11 de noviembre de 1799.",
"Luis XVI de Francia (en francés: Louis XVI; Versalles, 23 de agosto de 1754 – París, 21 de enero de 1793) fue rey de Francia y de Navarra4 entre 1774 y 1789, copríncipe de Andorra entre 1774 y 1793, y rey de los franceses3 entre 1789 y 1792.2 Fue el último monarca antes de la caída de la monarquía por la Revolución Francesa, así como el último que ejerció sus poderes de monarca absoluto.",
"Felipe VI de España (Madrid, 30 de enero de 1968) es el actual rey de España, título por el que ostenta la jefatura del Estado y el mando supremo de las Fuerzas Armadas, desde el 19 de junio de 2014, fecha en que ascendió al trono por la abdicación de su padre, el rey Juan Carlos I.",
"Lionel Andrés Messi Cuccittini (Rosario, 24 de junio de 1987), conocido como Leo Messi, es un futbolista argentino que juega como delantero o centrocampista. Jugador histórico del Fútbol Club Barcelona, al que estuvo ligado veinte años, desde 2021 integra el plantel del Paris Saint-Germain de la Ligue 1 de Francia. Es también internacional con la selección de Argentina, equipo del que es capitán."
]
query = "Listar aquellos personajes que tuvieron poder en Francia"
corpus_embeddings = model.encode(corpus)
query_embedding = model.encode(query)
hits = util.semantic_search(query_embedding, corpus_embeddings, top_k=2)[0]
for hit in hits:
print(f"corpus_id: {hit['corpus_id']}, score: {hit['score']}, text: {corpus[hit['corpus_id']][0:100]}...")
✨ 主な機能
📦 インストール
このモデルを使用するには、sentence-transformers
をインストールする必要があります。
pip install -U sentence-transformers
📚 ドキュメント
トレーニング設定
{
"model_name": "PlanTL-GOB-ES/roberta-base-bne",
"max_seq_length": 512,
"epochs": 10,
"warmup_steps": 1000,
"batch_size": 16,
"optimizer_params": {
"lr": 2e-05
},
"loss": "mnrl",
"dataset_train_size": 481335,
"dataset_name": "IIC/ms_marco_es",
"seed": 42,
"length_embedding": 768
}
トレーニングソースコード
トレーニングに使用されたソースコードは、以下のリンクから入手できます。
https://github.com/bukosabino/sbert-spanish/tree/main
🔧 技術詳細
このモデルは、PlanTL-GOB-ES/roberta-base-bne をファインチューニングしたもので、MS-MARCO dataset translated into Spanish を使用して質問応答タスクに特化してトレーニングされています。
💻 使用例
基本的な使用法
from sentence_transformers import SentenceTransformer, util
model = SentenceTransformer('dariolopez/roberta-base-bne-finetuned-msmarco-qa-es-mnrl-mn')
corpus = [
"Napoleón I Bonaparte (Ajaccio, 15 de agosto de 1769-Longwood, 5 de mayo de 1821) fue un militar y estadista francés, general republicano durante la Revolución francesa y el Directorio, y artífice del golpe de Estado del 18 de brumario que lo convirtió en primer cónsul (Premier Consul) de la República el 11 de noviembre de 1799.",
"Luis XVI de Francia (en francés: Louis XVI; Versalles, 23 de agosto de 1754 – París, 21 de enero de 1793) fue rey de Francia y de Navarra4 entre 1774 y 1789, copríncipe de Andorra entre 1774 y 1793, y rey de los franceses3 entre 1789 y 1792.2 Fue el último monarca antes de la caída de la monarquía por la Revolución Francesa, así como el último que ejerció sus poderes de monarca absoluto.",
"Felipe VI de España (Madrid, 30 de enero de 1968) es el actual rey de España, título por el que ostenta la jefatura del Estado y el mando supremo de las Fuerzas Armadas, desde el 19 de junio de 2014, fecha en que ascendió al trono por la abdicación de su padre, el rey Juan Carlos I.",
"Lionel Andrés Messi Cuccittini (Rosario, 24 de junio de 1987), conocido como Leo Messi, es un futbolista argentino que juega como delantero o centrocampista. Jugador histórico del Fútbol Club Barcelona, al que estuvo ligado veinte años, desde 2021 integra el plantel del Paris Saint-Germain de la Ligue 1 de Francia. Es también internacional con la selección de Argentina, equipo del que es capitán."
]
query = "Listar aquellos personajes que tuvieron poder en Francia"
corpus_embeddings = model.encode(corpus)
query_embedding = model.encode(query)
hits = util.semantic_search(query_embedding, corpus_embeddings, top_k=2)[0]
for hit in hits:
print(f"corpus_id: {hit['corpus_id']}, score: {hit['score']}, text: {corpus[hit['corpus_id']][0:100]}...")
使用上の注意事項
モデルの使用言語
このモデルは、主にスペイン語の質問応答タスクに設計されています。
最大入力長
デフォルトでは、512単語以上の入力テキストは切り捨てられます。
📄 ライセンス
この作品は、Apache License, Version 2.0 の下でライセンスされています。