Teraflop Minn Caselaw
T
Teraflop Minn Caselaw
由conceptofmind開發
基於ModernBERT-base的句子嵌入模型,用於句子相似度和特徵提取任務
下載量 253
發布時間 : 3/8/2025
模型概述
該模型基於ModernBERT-base架構,經過微調用於生成高質量的句子嵌入,支持句子相似度計算和特徵提取任務
模型特點
高效句子嵌入
能夠將輸入句子轉換為高質量的向量表示,捕捉語義信息
多任務優化
使用CachedMultipleNegativesRankingLoss進行訓練,優化句子相似度任務
大規模訓練數據
在248,554條數據上進行訓練,具有較好的泛化能力
模型能力
句子相似度計算
文本特徵提取
語義搜索
文本聚類
使用案例
信息檢索
法律文檔檢索
根據用戶查詢檢索相關法律文檔
如示例所示,可以準確匹配用戶查詢與法律文檔內容
問答系統
城市管理問答
回答關於城市管理職責的問題
如示例所示,可以準確匹配問題與相關法規內容
🚀 基於answerdotai/ModernBERT-base的句子轉換器
本項目是一個基於answerdotai/ModernBERT-base在test-minn數據集上微調的句子轉換器模型。它能將句子和段落映射到768維的密集向量空間,可用於語義文本相似度計算、語義搜索、釋義挖掘、文本分類、聚類等任務。
🚀 快速開始
模型詳情
模型描述
屬性 | 詳情 |
---|---|
模型類型 | 句子轉換器 |
基礎模型 | answerdotai/ModernBERT-base |
最大序列長度 | 8192個標記 |
輸出維度 | 768維 |
相似度函數 | 餘弦相似度 |
訓練數據集 | test-minn |
模型來源
- 文檔:句子轉換器文檔
- 倉庫:GitHub上的句子轉換器
- Hugging Face:Hugging Face上的句子轉換器
完整模型架構
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: ModernBertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
使用方法
直接使用(句子轉換器)
首先安裝句子轉換器庫:
pip install -U sentence-transformers
然後加載模型並進行推理:
from sentence_transformers import SentenceTransformer
# 從🤗 Hub下載
model = SentenceTransformer("conceptofmind/teraflop-minn-caselaw")
# 運行推理
sentences = [
'明尼蘇達州法院對共同擁有農場分割的裁決',
"ELLEN BRANDIN訴JASPER SWENSON。\n1925年6月19日。\n第24,681號。\n8. H. Écfanqn,代表上訴人。\nJohn Heitmarm,代表被上訴人。\n報道於204 N. W. 468。\n\nDibell法官。\n聖路易斯縣的訴訟,請求判定原告為一塊80英畝土地的所有者,若該請求被駁回,則請求對該土地進行分割。法院判決進行實物分割,原告提起上訴。\n證據未被返還。正如上訴人的律師正確指出的,唯一的問題是事實認定是否支持該判決;在陳述事即時,我們遵循了初審法院的認定。\n1906年2月10日,原告Ellen Brandin與被告Jasper Swenson舉行了結婚儀式。當時,原告有一位在世的丈夫。他在10年前拋棄了她,她和被告都以為他已經去世。1920年,人們發現他還活著;1922年1月8日,法院作出判決,宣佈原告和被告的婚姻無效。\n1906年4月9日,原告和被告作為共同租戶購買了一塊80英畝的土地,契約上寫著兩人的名字。購買價格由原告支付,但其中一部分是被告在正式結婚後用自己的收入給她的,不久後,他給她的錢超過了他應承擔的一半購買價格。1907年,被告搬到了這塊土地上居住,並對其中40英畝進行了改良。原告繼續住在德盧斯,經營一家寄宿公寓。她為農場的改良做出了貢獻,並從農場獲得現金和農產品。法院將80英畝土地中的西40英畝判給了她,將被告進行了改良的東40英畝判給了被告。這是基於法院的認定,即西40英畝的價值與原告的貢獻價值之比,大致等於東40英畝的價值與被告的貢獻價值之比。這是一種公平的分割方式。雙方各獲得了一半面積的土地。被告獲得了他進行了改良的40英畝土地。雙方獲得的價值與各自的貢獻成比例。Hunt訴Meeker County A. & L. Co. 135 Minn. 134, 160 N. W. 496案中所述的原則支持了這種分割方式。就本案的記錄而言,訴狀的形式和採用的程序並不重要。雙方均未對此提出異議。\n判決維持原判。",
'明尼蘇達州,被上訴人,訴James Darrell GIBSON,上訴人。\n第C1 - 91 - 1332號。\n明尼蘇達州最高法院。\n1991年12月20日。\nJohn M. Stuart,州公設辯護人,Mark F. Anderson,助理州公設辯護人,明尼阿波利斯,代表上訴人。\nScott A. Hersey,伊桑蒂縣檢察官,劍橋,以及Hubert H. Humphrey III,州檢察長,聖保羅,代表被上訴人。\n\nTOMLJANOVICH法官。\n在本案的判決中,上訴法院維持了對被告兩項罪行判處多項並行刑期的決定,被告認為這兩項罪行源於同一行為事件。State v. Gibson, 475 N.W.2d 896 (Minn.App.1991)。我們同意被告的觀點,因此根據明尼蘇達州法規§ 609.035 (1990),即所謂的單一行為事件法規,撤銷兩項刑期中較輕的一項。\n被告被定罪的罪行是導致他人受傷的刑事車輛操作和肇事逃逸重罪,他因此被判處23個月和15個月的並行刑期。第一項定罪基於被告在醉酒狀態下駕車發生正面碰撞的事實。第二項定罪基於事故發生後,被告和另一輛車的司機均受傷,被告立即徒步逃離現場,前往附近的農舍並打電話讓他的女友來接他的事實。\n明尼蘇達州法規§ 609.035相關部分規定,如果一個人的行為“構成該州法律規定的多項罪行,此人只能因其中一項罪行受到懲罰”。我們在確定兩項非故意犯罪或一項非故意犯罪和一項故意犯罪是否屬於同一行為過程時所採用的方法是,分析所有事實,確定這些罪行是否“源於持續且不間斷的行為過程,表現出不可分割的心態或一致的判斷失誤”。State v. Sailor, 257 N.W.2d 349, 352 (Minn.1977); 另見State v. Johnson, 273 Minn. 394, 405, 141 N.W.2d 517, 525 (1966)。當兩項罪行均為故意犯罪時,我們關注的因素包括時間和地點,以及所涉行為是否出於實現單一犯罪目標的動機。State v. Johnson, supra。\n在一系列判決中——即逃避逮捕案件——我們認為,如果被告在實施第一項罪行後,基本上同時實施第二項罪行以逃避對第一項罪行的逮捕,則不得對這兩項罪行判處多項刑期。State v. Gilbertson, 323 N.W.2d 810 (Minn.1982); State v. Zuehlke, 320 N.W.2d 79 (Minn.1982); State v. Boley, 299 N.W.2d 924 (Minn.1980); Matter of Castillo, 293 N.W.2d 839 (Minn.1980); State v. White, 292 N.W.2d 16 (Minn.1980); State v. Finn, 295 Minn. 520, 203 N.W.2d 114 (1972)。\n在本案中,被告實施肇事逃逸的重罪行為,部分是為了逃避因事故所涉任何罪行而被逮捕。因此,我們撤銷兩項刑期中較輕的一項,即肇事逃逸的15個月並行刑期。\n部分維持原判,部分撤銷原判。\n. 與逃避逮捕案件密切相關的是便利犯罪案件。見State v. Naylor, 474 N.W.2d 314 (Minn.1991); State v. Beito, 332 N.W.2d 645 (Minn.1983)。',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# 獲取嵌入向量的相似度分數
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
📚 詳細文檔
訓練詳情
訓練數據集
test - minn
- 數據集:[test - minn](https://huggingface.co/datasets/conceptofmind/test - minn),版本為[a383680](https://huggingface.co/datasets/conceptofmind/test - minn/tree/a383680981f01a8de7e236c733f60f4af36ee227)
- 規模:248,554個訓練樣本
- 列名:
query
和reponse
- 基於前1000個樣本的近似統計信息:
| | 查詢(query) | 回覆(reponse) |
| ---- | ---- | ---- |
| 類型 | 字符串 | 字符串 |
| 詳情 |
- 最小:4個標記
- 平均:15.14個標記
- 最大:31個標記
- 最小:119個標記
- 平均:2706.53個標記
- 最大:8192個標記
- 樣本:
| 查詢(query) | 回覆(reponse) |
| ---- | ---- |
|
種子穀物票據在財產留置權和催收中的作用
|WINTER & AMES COMPANY訴ATLANTIC ELEVATOR COMPANY。
| |
1903年1月9日。
第13,155 — (140)號。
代理人的權限 — 證據。
經審查,證據足以支持初審法院的認定,即原告的一名代理人有權授權出售原告憑藉種子穀物票據對其享有留置權的某些亞麻籽,並解除所享有的留置權。
明尼阿波利斯市法院的訴訟,要求被告賠償250美元及利息,因其侵佔了某些亞麻籽。案件由Holt法官審理,他作出了有利於被告的判決。原告因法院駁回其重審動議的命令而提起上訴。
維持原判。
L. J. Van Fossen,代表上訴人。
Wilson & Van Derlip,代表被上訴人。
報道於92 N. W. 955。
BROWN法官。
原告提起訴訟,要求被告賠償其聲稱被被告侵佔的某些亞麻籽的價值。初審法院作出了有利於被告的判決,原告因法院駁回其重審動議的命令而提起上訴。
簡要事實如下...關於涉及描述錯誤的抵押和判決的優先權糾紛?
|Lucy H. Gill訴William C. Russell等人。
| |
1877年2月12日。
由仲裁員取證的例外情況。 — 在僅由為此目的指定的仲裁員取證並報告的案件聽證會上,希望利用在仲裁員面前提出的任何異議的一方,必須重新提出該異議,並獲得法院對此的裁決;如果裁決不利,則需提出異議。
禁止反言 — 公司董事不能從公司在其參與制定的抵押中的錯誤中獲利。 — B公司為原告正式簽署了一份房地產抵押協議,以換取有價值的對價。由於雙方的共同錯誤,該抵押協議錯誤地描述了雙方意圖並同意抵押的房產。原告使該抵押協議得到了正式登記。B公司的一名董事參與了抵押協議的簽署和錯誤的發生,後來他獲得了對該公司的判決,並正式將其記錄在案,使其成為對該房產的留置權,...可以基於哪些理由對針對鐵路公司的疏忽索賠提出質疑?
|Iver Anderson訴Southern Minnesota Railroad Company。
|
1874年8月10日。
公司放棄對傳票送達瑕疵的抗辯。 — 公司在治安法院的訴訟中進行了全面出庭並就案情進行了答辯後,不能再以傳票送達不符合法規要求為由提出異議。
治安法官 — 延期 — 案卷記錄。 — 案卷記錄“經雙方同意,案件延期至1873年9月23日星期一下午一點”,足以符合法規要求,即治安法官應在其案卷中記錄“每次延期,說明延期的時間和地點”。
本案在治安法院提起,原告獲得了判決。被告就法律問題向菲爾莫爾縣地區法院提起上訴,由Waterman法官主審。地區法院推翻了治安法院的判決,作出了有利於被告的判決,原告對此提起上訴。案件情況在... - 損失函數:
CachedMultipleNegativesRankingLoss
,參數如下:
{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
評估數據集
test - minn
- 數據集:[test - minn](https://huggingface.co/datasets/conceptofmind/test - minn),版本為[a383680](https://huggingface.co/datasets/conceptofmind/test - minn/tree/a383680981f01a8de7e236c733f60f4af36ee227)
- 規模:248,554個評估樣本
- 列名:
query
和reponse
- 基於前1000個樣本的近似統計信息:
| | 查詢(query) | 回覆(reponse) |
| ---- | ---- | ---- |
| 類型 | 字符串 | 字符串 |
| 詳情 |
- 最小:3個標記
- 平均:14.9個標記
- 最大:33個標記
- 最小:131個標記
- 平均:2599.64個標記
- 最大:8192個標記
- 樣本:
| 查詢(query) | 回覆(reponse) |
| ---- | ---- |
|
欺詐性蜜蜂銷售中“蜂腐病”的法律定義
|C. E. SAMPSON訴F. C. PENNEY。
| |
1922年2月17日。
第22,564號。
因證據不足以支持判決而進行重審。
1. 在蜜蜂銷售中,如果某些陳述被證明是虛假的,則所有欺詐要素均已存在。但對於虛假陳述的證明是否充分存在疑問。然而,必須基於證據不足以支持判決中關於損害賠償金額的部分而進行重審。
欺詐性銷售患病蜜蜂的直接和間接損害賠償標準。
3. 因欺詐而誘使簽訂合同的直接損害,是受欺詐方所放棄的東西與所獲得的東西之間的價值差異。除此之外,受欺詐方還可以要求賠償自然且直接因違約而產生的間接損害。如果某人通過欺詐手段促成了患有疾病的動物的銷售,購買者可以要求賠償其自身其他動物因感染該疾病而遭受的損失,但不能要求賠償...哪些案例根據小偷是否在逃跑來區分責任?
|ANNE WANNEBO訴ELNATHAN GATES等人。
| |
1948年11月26日。
第34,713號。
Meagher, Geer & Markham和Clyde F. Anderson,代表上訴人。
R. 8. hammers和Allan h. Johnson,代表被上訴人。
報道於34 N. W. (2d) 695。
Magney法官。
被告因法院駁回其對本案訴狀的異議的命令而提起上訴,所提出的問題已被證明是重要且有疑問的。
1947年7月2日,被告Frances L. Gates將被告Elnathan Gates擁有的一輛汽車停在明尼阿波利斯市商業區的一條公共街道上。她去購物,將車無人看管地留在那裡,車門和點火裝置都未鎖。她沒有將鑰匙從點火開關上取下帶走。汽車被盜。當晚大約11:30,這輛被盜的汽車被一名身份不明的人疏忽駕駛,與原告的汽車相撞,損壞了原告的汽車並使其受傷。以上事實簡要陳述了被告提出異議的訴狀中的主要指控。
一項條例的第11部分...遺囑人與受益人之間的關係如何影響明尼蘇達州關於不當影響的索賠?
|Gerald Charles ANDERSON遺產案。
|
第C5 - 85 - 871號。
明尼蘇達州上訴法院。
1985年12月24日。
複審請求於1986年2月19日被駁回。
Richard A. Beens,代表上訴人Mary Ann Reynolds。
Rolf T. Nelson,代表被上訴人Sally Ann Sellers、Carol Ann Young、Robert Charles Anderson和Carl Earl Anderson。
由HUS - PENI法官、FOLEY法官和FORSBERG法官審理並裁決。
意見
HUSPENI法官。
上訴人Mary Ann Reynolds是死者Gerald Anderson的女兒,她試圖將死者遺囑的第二份附錄進行遺囑認證。被上訴人是死者的其他四個子女,他們反對對該第二份附錄進行遺囑認證。一個諮詢陪審團認定,第二份附錄是在Reynolds施加的不當影響下籤署的。初審法院採納了諮詢陪審團關於存在不當影響的認定。Reynolds因法院駁回對第二份附錄進行遺囑認證的命令以及駁回其修改事實認定或進行重審的動議而提起上訴。我們撤銷原判。 - 損失函數:
CachedMultipleNegativesRankingLoss
,參數如下:
{
"scale": 20.0,
"similarity_fct": "cos_sim"
}
訓練超參數
非默認超參數
eval_strategy
:按步數評估per_device_train_batch_size
:1024per_device_eval_batch_size
:1024learning_rate
:0.0003num_train_epochs
:1warmup_ratio
:0.1bf16
:Truebatch_sampler
:無重複採樣
所有超參數
點擊展開
overwrite_output_dir
:Falsedo_predict
:Falseeval_strategy
:stepsprediction_loss_only
:Trueper_device_train_batch_size
:1024per_device_eval_batch_size
:1024per_gpu_train_batch_size
:Noneper_gpu_eval_batch_size
:Nonegradient_accumulation_steps
:1eval_accumulation_steps
:Nonetorch_empty_cache_steps
:Nonelearning_rate
:0.0003weight_decay
:0.0adam_beta1
:0.9adam_beta2
:0.999adam_epsilon
:1e-08max_grad_norm
:1.0num_train_epochs
:1max_steps
:-1lr_scheduler_type
:linearlr_scheduler_kwargs
:{}warmup_ratio
:0.1warmup_steps
:0log_level
:passivelog_level_replica
:warninglog_on_each_node
:Truelogging_nan_inf_filter
:Truesave_safetensors
:Truesave_on_each_node
:Falsesave_only_model
:Falserestore_callback_states_from_checkpoint
:Falseno_cuda
:Falseuse_cpu
:Falseuse_mps_device
:Falseseed
:42data_seed
:Nonejit_mode_eval
:Falseuse_ipex
:Falsebf16
:Truefp16
:Falsefp16_opt_level
:O1half_precision_backend
:autobf16_full_eval
:Falsefp16_full_eval
:Falsetf32
:Nonelocal_rank
:0ddp_backend
:Nonetpu_num_cores
:Nonetpu_metrics_debug
:Falsedebug
:[]dataloader_drop_last
:Falsedataloader_num_workers
:0dataloader_prefetch_factor
:Nonepast_index
:-1disable_tqdm
:Falseremove_unused_columns
:Truelabel_names
:Noneload_best_model_at_end
:Falseignore_data_skip
:Falsefsdp
:[]fsdp_min_num_params
:0fsdp_config
:{'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
:Noneaccelerator_config
:{'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
:Nonelabel_smoothing_factor
:0.0optim
:adamw_torchoptim_args
:Noneadafactor
:Falsegroup_by_length
:Falselength_column_name
:lengthddp_find_unused_parameters
:Noneddp_bucket_cap_mb
:Noneddp_broadcast_buffers
:Falsedataloader_pin_memory
:Truedataloader_persistent_workers
:Falseskip_memory_metrics
:Trueuse_legacy_prediction_loop
:Falsepush_to_hub
:Falseresume_from_checkpoint
:Nonehub_model_id
:Nonehub_strategy
:every_savehub_private_repo
:Nonehub_always_push
:Falsegradient_checkpointing
:Falsegradient_checkpointing_kwargs
:Noneinclude_inputs_for_metrics
:Falseinclude_for_metrics
:[]eval_do_concat_batches
:Truefp16_backend
:autopush_to_hub_model_id
:Nonepush_to_hub_organization
:Nonemp_parameters
:auto_find_batch_size
:Falsefull_determinism
:Falsetorchdynamo
:Noneray_scope
:lastddp_timeout
:1800torch_compile
:Falsetorch_compile_backend
:Nonetorch_compile_mode
:Nonedispatch_batches
:Nonesplit_batches
:Noneinclude_tokens_per_second
:Falseinclude_num_input_tokens_seen
:Falseneftune_noise_alpha
:Noneoptim_target_modules
:Nonebatch_eval_metrics
:Falseeval_on_start
:Falseuse_liger_kernel
:Falseeval_use_gather_object
:Falseaverage_tokens_across_devices
:Falseprompts
:Nonebatch_sampler
:no_duplicatesmulti_dataset_batch_sampler
:proportional
訓練日誌
輪次(Epoch) | 步數(Step) | 訓練損失(Training Loss) | 驗證損失(Validation Loss) |
---|---|---|---|
0.0457 | 10 | 6.5431 | - |
0.0913 | 20 | 4.3376 | - |
0.1370 | 30 | 3.0217 | - |
0.1826 | 40 | 2.5811 | - |
0.2283 | 50 | 2.4191 | 2.2439 |
0.2740 | 60 | 2.2218 | - |
0.3196 | 70 | 2.1584 | - |
0.3653 | 80 | 2.0668 | - |
0.4110 | 90 | 2.0528 | - |
0.4566 | 100 | 2.0014 | 1.9200 |
0.5023 | 110 | 1.9779 | - |
0.5479 | 120 | 1.9102 | - |
0.5936 | 130 | 1.9071 | - |
0.6393 | 140 | 1.8794 | - |
0.6849 | 150 | 1.8269 | 1.8022 |
0.7306 | 160 | 1.8606 | - |
0.7763 | 170 | 1.8572 | - |
0.8219 | 180 | 1.8332 | - |
0.8676 | 190 | 1.8227 | - |
0.9132 | 200 | 1.7875 | 1.7674 |
0.9589 | 210 | 1.8351 | - |
框架版本
- Python:3.11.9
- Sentence Transformers:3.4.1
- Transformers:4.49.0
- PyTorch:2.6.0+cu124
- Accelerate:1.4.0
- Datasets:3.3.2
- Tokenizers:0.21.0
📄 引用
BibTeX
句子轉換器
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
CachedMultipleNegativesRankingLoss
@misc{gao2021scaling,
title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
year={2021},
eprint={2101.06983},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
Jina Embeddings V3
Jina Embeddings V3 是一個多語言句子嵌入模型,支持超過100種語言,專注於句子相似度和特徵提取任務。
文本嵌入
Transformers 支持多種語言

J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
基於MS Marco段落排序任務訓練的交叉編碼器模型,用於信息檢索中的查詢-段落相關性評分
文本嵌入 英語
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
基於蒸餾技術的稀疏檢索模型,專為OpenSearch優化,支持免推理文檔編碼,在搜索相關性和效率上優於V1版本
文本嵌入
Transformers 英語

O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
基於PubMedBERT的生物醫學實體表徵模型,通過自對齊預訓練優化語義關係捕捉
文本嵌入 英語
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Large 是一個強大的句子轉換器模型,專注於句子相似度和文本嵌入任務,在多個基準測試中表現出色。
文本嵌入 英語
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 是一個英文句子轉換器模型,專注於句子相似度任務,在多個文本嵌入基準測試中表現優異。
文本嵌入
Transformers 支持多種語言

G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base 是一個多語言的句子嵌入模型,支持超過50種語言,適用於句子相似度計算等任務。
文本嵌入
Transformers 支持多種語言

G
Alibaba-NLP
1.2M
246
Polybert
polyBERT是一個化學語言模型,旨在實現完全由機器驅動的超快聚合物信息學。它將PSMILES字符串映射為600維密集指紋,以數值形式表示聚合物化學結構。
文本嵌入
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
基於土耳其語BERT的句子嵌入模型,專為語義相似度任務優化
文本嵌入
Transformers 其他

B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
基於BAAI/bge-small-en-v1.5模型微調的文本嵌入模型,通過MEDI數據集與MTEB分類任務數據集訓練,優化了檢索任務的查詢編碼能力。
文本嵌入
Safetensors 英語
G
avsolatorio
945.68k
29
精選推薦AI模型
Llama 3 Typhoon V1.5x 8b Instruct
專為泰語設計的80億參數指令模型,性能媲美GPT-3.5-turbo,優化了應用場景、檢索增強生成、受限生成和推理任務
大型語言模型
Transformers 支持多種語言

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一個基於SODA數據集訓練的超小型對話模型,專為邊緣設備推理設計,體積僅為Cosmo-3B模型的2%左右。
對話系統
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基於RoBERTa架構的中文抽取式問答模型,適用於從給定文本中提取答案的任務。
問答系統 中文
R
uer
2,694
98