🚀 Italian-ModernBERT-base-embed-mmarco-mnrl
This is a sentence-transformers model finetuned from DeepMount00/Italian-ModernBERT-base on the mmarco dataset. It maps sentences & paragraphs to a 768 - dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

✨ Features
- Tags: sentence-transformers, sentence-similarity, feature-extraction, generated_from_trainer
- Dataset size: 39,780,811
- Loss functions: MatryoshkaLoss, MultipleNegativesRankingLoss
- Base model: DeepMount00/Italian-ModernBERT-base
- Pipeline tag: sentence-similarity
- Library name: sentence-transformers
- Metrics: cosine_accuracy
📦 Installation
First install the Sentence Transformers library:
pip install -U sentence-transformers
💻 Usage Examples
Basic Usage
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("Italian-ModernBERT-base-embed-mmarco-mnrl")
sentences = [
'chi è copa airlines?',
"Copa Airlines è la principale compagnia aerea di Panama, con sede a Panama City. Le operazioni del Copa sono concentrate presso l'aeroporto internazionale di Tocumen, situato a 15 miglia da Panama City. Fondata nel 1947, Copa Airways ha iniziato con tre voli nazionali all'interno di Panama e oggi la compagnia vola verso 29 paesi e 64 destinazioni in Nord e Sud America e nei Caraibi.",
"AIUTO: Ti trovi sulla pagina dei risultati dal vivo di Copa America amÃ'©rica 2015 In/Soccer South america. FlashScore.flashscore com offre classifiche Copa america amÃ'©rica, livescore 2015 e risultati parziali copa america amÃ'©rica 2015 (e partita, dettagli goal, marcatori rosso, †¦). confronto quote carte",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
📚 Documentation
Model Details
Model Description
Property |
Details |
Model Type |
Sentence Transformer |
Base model |
DeepMount00/Italian-ModernBERT-base |
Maximum Sequence Length |
8192 tokens |
Output Dimensionality |
768 dimensions |
Similarity Function |
Cosine Similarity |
Training Dataset |
mmarco |
Model Sources
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: ModernBertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Evaluation
Metrics - Triplet
Metric |
mmarco_dev |
mmarco_test |
cosine_accuracy |
0.9255 |
0.913 |
Training Details
Training Dataset - mmarco
- Dataset: mmarco
- Size: 39,780,811 training samples
- Columns:
query
, positive
, and negative
- Approximate statistics based on the first 1000 samples:
|
query |
positive |
negative |
type |
string |
string |
string |
details |
- min: 4 tokens
- mean: 10.93 tokens
- max: 26 tokens
|
- min: 21 tokens
- mean: 95.12 tokens
- max: 532 tokens
|
- min: 20 tokens
- mean: 87.17 tokens
- max: 423 tokens
|
- Samples:
query |
positive |
negative |
cosa significa tbh nei messaggi? |
TBH significa essere onesti. TBH Significato: essere onesti. Ci sono quasi 6 milioni di foto con l'hashtag TBH su Instagram. TBH, o To Be Honest, è un acronimo particolarmente popolare su Facebook, ma utilizzato frequentemente anche quando si inviano messaggi di testo, messaggi o chat online. TBH significa âÂÀœPer essere onesti, Â⠀ . |
Ora le chiamate e gli sms possono essere fatti praticamente ovunque. Il Wi-Fi è ovunque e oggi il tuo telefono si connette a ogni singola connessione Wi-Fi come se fossero torri T-Mobile. In realtà, falle diventare le tue torri. Ora puoi scegliere come connetterti, indipendentemente da dove ti trovi, a casa, in ufficio, anche fuori dalla portata del cellulare. |
effetti del tè nero sul corpo |
Gli effetti collaterali del bere troppo tè nero includono difficoltà a dormire, mal di testa, nervosismo, diarrea, irritabilità, battito cardiaco irregolare, confusione, bruciore di stomaco, tremori alle estremità e possibilmente convulsioni. Questi effetti collaterali sono tutti il risultato del contenuto di caffeina nel tè nero. Se sei abituato a bere regolarmente tè nero, in particolare in quantità maggiori, potresti sviluppare una dipendenza fisica e psicologica dalla bevanda, ancora una volta, principalmente a causa del contenuto di caffeina. |
Un tipo di tè meno conosciuto, il tè oolong è ottenuto dalle foglie della pianta Camellia sinensis, la stessa pianta utilizzata per produrre tè nero e verde. A differenza del tè nero, che viene ossidato fino a quando le foglie non assumono un colore nero intenso, il tè oolong è parzialmente ossidato. I benefici del tè Oolong. |
un genitore può prelevare dal conto di un minore? |
Il custode di un conto UGMA/UTMA controlla e gestisce i beni di un minore (il beneficiario del conto). Non è necessario che un genitore sia il custode dell'account e puoi scegliere qualcun altro per gestire un account UGMA / UTMA per conto di tuo figlio. Il custode di un account UGMA / UTMA controlla e gestisce il patrimonio di un minore (il beneficiario del conto). Non è necessario che un genitore sia il custode dell'account e puoi scegliere qualcun altro per gestire un UGMA / UTMA per conto di tuo figlio. |
Ciò significa che il totale del tuo a |
🔧 Technical Details
Model Index
- Name: SentenceTransformer based on DeepMount00/Italian-ModernBERT-base
- Results:
- Task:
- Type: triplet
- Name: Triplet
- Dataset:
- Name: mmarco dev
- Type: mmarco_dev
- Metrics:
- Type: cosine_accuracy
- Value: 0.9254999756813049
- Name: Cosine Accuracy
- Task:
- Type: triplet
- Name: Triplet
- Dataset:
- Name: mmarco test
- Type: mmarco_test
- Metrics:
- Type: cosine_accuracy
- Value: 0.9129999876022339
- Name: Cosine Accuracy