Ruropebert E5 Base 512 Allru Authorship
R
Ruropebert E5 Base 512 Allru Authorship
asaakyanによって開発
BERTアーキテクチャに基づくロシア語のRoPE埋め込みモデルで、文章の類似度と特徴抽出タスクに最適化されています。
ダウンロード数 37
リリース時間 : 12/5/2024
モデル概要
このモデルはBERTアーキテクチャに基づくロシア語の事前学習モデルで、RoPE(Rotary Position Embedding)位置符号化を採用しており、主に文章の類似度計算と特徴抽出タスクに使用されます。モデルは最大512のシーケンス長をサポートし、対比損失関数を使用して訓練されています。
モデル特徴
RoPE位置符号化
Rotary Position Embedding技術を採用しており、長いシーケンスと位置情報をより良く処理することができます。
対比損失訓練
対比損失関数を使用して最適化されており、文章の類似度タスクに特に適しています。
大容量の訓練データ
246万件のロシア語の文章ペアで訓練されており、強力な意味理解能力を持っています。
モデル能力
文章の埋め込み生成
意味的類似度計算
テキストの特徴抽出
文章レベルの意味理解
使用事例
情報検索
類似ドキュメントの検索
入力された文章に基づいて、意味的に類似したドキュメントまたは段落を検索します。
検索の関連性と正確性を向上させます。
スマートカスタマーサポート
質問のマッチング
ユーザーの質問と知識ベース内の類似した質問をマッチングします。
自動質問応答システムの正確率を向上させます。
コンテンツ推薦
関連コンテンツの推薦
ユーザーが閲覧したコンテンツに基づいて、意味的に類似した他のコンテンツを推薦します。
ユーザーの関与度と満足度を向上させます。
🚀 センテンストランスフォーマーモデル
このモデルは、センテンスの類似度計算や特徴抽出に特化したモデルです。Tochka - AI/ruRoPEBert - e5 - base - 512をベースモデルとしており、ContrastiveLossを損失関数として使用しています。
📋 モデル情報
属性 | 詳情 |
---|---|
モデルタイプ | sentence - transformers |
データセットサイズ | 2465773 |
損失関数 | ContrastiveLoss |
ベースモデル | Tochka - AI/ruRoPEBert - e5 - base - 512 |
📚 ウィジェットの使用例
ウィジェットでは、ソース文と比較する文を入力することで、センテンスの類似度を計算できます。以下にいくつかのサンプルケースを示します。
サンプルケース1
- ソース文:
「Вообще-то, цветущая весна здесь началась ещё в начале февраля, 但我不想过早用温暖来刺激人们,直到冬天结束。而现在 - 正是时候!所有的照片都是我在城市公园或城市附近拍摄的。在这里度过冬天是一种享受!天气非常舒适,有很多绿色植物,现在还有鲜花 - 自己欣赏吧 :3
。哇,真是个美人!我已经等了将近一个月,等整棵树开花,但感觉好像下面绽开的花蕾被人折断了 - 昨天还有,今天就没了。也许它们只是掉落了,今天我正好捡了几个。而这个灌木丛整个冬天都在开花。这里有几种这样的黄色灌木丛,有些还很香。在这里我特意为你们找到了名字 - 红色的木瓜!或者简单地说就是日本海棠。我已经习惯了树上白色和粉色的小花,而这种浓郁的红色让人惊喜。这是 开的花,评论里有人给我提示了 =) 有趣的是,到现在还有一些秋天的叶子(而在12月我已经收集了非常漂亮的植物标本)。这就是秋天和春天的对比。这是茉莉花。好像是。嗯,我隐约听到导游阿姨在说。而这个我肯定知道 - 野生仙客来。是最早开花的花之一,覆盖着森林草地 - 非常可爱,从2月初就开始开花了。雪花莲在2月和仙客来一起开花。很快我们这里的 就要开花了。我等啊等 _ 当然,还有 !如果站在合适的地方,遇到合适的风,就能闻到美妙的香气 =) 如果你有“我要不要去索契”的想法 - 就下定决心吧!这里不仅有可以欣赏大海的空旷海滩,而且在绿色植物和鲜花中散步也非常愉快。」 - 比較文:
- 「Урал радует разнообразием. В лёгкой пешей прогулке между деревеньками и дачами можно увидеть... Выработанный мраморный карьер. Как после хорошего дождя тропинки становятся белыми. Карьер, как это часто бывает, заполнен водой и служит местом отдыха. С определённых ракурсов вода приобретает очень красивый оттенок. На такой почве очень хорошо растёт облепиха. А дорога под ногами блестит и переливается бликами от солнца, но этого я вам не покажу. В нескольких дестяках метров от карьера есть небольшой водопад. Маленький, но симпатичный. И даже ущелье! Или каньон? Неподалёку располагается ни много ни мало памятник природы - базальтовые скалы. Похоже на поджаренную щепку, правда? Только гораааздо больше. И скала. Вы уже заметили по теням, какой тут стройный хвойный лес? А ещё тут растут люпины, прямо как в Зеландиях и Исландиях. [Помимо них ещё красиво цветёт Иван - чай в окрестностях.] Ну и завершим прогулку красивым закатом, хотя они в любом месте красивы - за это люблю свою планету. Конечно, ещё есть река, поля, грибы, лесные озёра и что-то, до чего мы ещё не прогулялись. Доехать можно хоть на электричке - 47 или 49 км. В окрестных деревнях тоже есть на что посмотреть. Красота ближе, чем вы думаете ;)」
- 「Может люди работают до поздна? Приходят в 22, что им теперь дела домашние не делать? Явно косяк со слышимостью. Вам мешают - сразу пара долбоебов. У нас раньше такая херня была - внизу соседи слышали как мы ходим и даже как компьютерное кресло двигается. Тоже истерики устраивали, мой к ним содил поговорить, позвонил мне попросил походить. Да, говорит слышно сильно. А знаете в чем прикол? В том что я не топаю. Я хожу тихо. Тут именно вибрация. Поменяли кресло - специально когда покупали катали чтобы вообще не было слышно, постелили ковёр. Вроде перестали на нас жаловаться. С той квартиры мы съехали, сейчас там живет мама молодого человека моего. Так на нее они гонят за то что стиралку ночью включает! На кухне. Стиралка ее из тех что идёт на взлёт. При нас не жаловались. Но видимо доебаться надо. Может и вы такой? Может вам надо доебаться?」
- 「"Позиция нажатого элемента ListView и её получение в запущенном активити\nВсем добрый день.\nПосле нажатия на элемент списка listview, нужно передать его позицию (номер элемента списка) в другое активити. Использую position, которая передается в onListItemClick. Но в другое активити почему то передается null.\nПомогите разобраться))\n[code]\n public class MainActivity extends ListActivity {\n @Override\n protected void onListItemClick(ListView l, View v, int position, long id) {\n super.onListItemClick(l, v, position, id);\n Intent intent = new Intent(getApplicationContext(), AfterClickActivity.class);\n intent.putExtra("position",position);\n startActivity(intent);\n }\n @Override\n protected void onCreate(Bundle savedInstanceState) {\n Integer[] array = new Integer[100];\n for (int i = 0; i <100 ; i++) {\n array[i] = i;\n }\n super.onCreate(savedInstanceState);\n ArrayAdapter adapter = new ArrayAdapter(getApplicationContext(),R.layout.list_item,R.id.tvText,array);\n setListAdapter(adapter);\n[/code]\n}\n[code]\n public class AfterClickActivity extends ActionBarActivity {\n @Override\n protected void onCreate(Bundle savedInstanceState) {\n super.onCreate(savedInstanceState);\n setContentView(R.layout.activity_after_click);\n String position = getIntent().getStringExtra("position");\n TextView view = (TextView)findViewById(R.id.tvView1);\n view.setText(String.valueOf(position));\n }\n[/code]"」
サンプルケース2
- ソース文:
「Здравствуйте, попал в не приятную ситуацию. В октябре на МКАД произошло мелкое ДТП я на грузовой машине легонько притер
сам виноват, не соблюдал дистанцию. За рулём девушка, поговорили оформили евро протокол и разъехались. Протокол в страховую компанию надо было предоставить в течение пяти дней. Грузовая машина оформлена на предприятие где я работаю. Через день с механиком поехали в страховую, а там висит объявление что прием заявлений и протоколов временно приостановлен. Сколько это "временно "продлилось. Не известно. Сегодня пришло письмо из Росгосстраха, о том что я вовремя не предоставил соответствующие документы и выплата по ремонту 18800к возлагается на меня. В страховую больше не приезжал. Как быть?」 - 比較文:
- 「Кстати ole72ole я писал уже выше насчёт книги "Пластичность мозга", там в самой первой главе говорится о женщине которая всё время падала и о методах которыми её смогли восстановить. Хорошо бы показать эту книгу его родственникам, чтобы в свою очередь они прочитали и рассказали о методах лечащему врачу. Вот начало этой главы, мне кажется или у вашего сопалатника похожая ситуация только чуть всё иначе? Могу скинуть если напишешь свою почту эту книгу, т.к. на пикабу я не нашёл Личных сообщений, а в свободном доступе (бесплатно) книгу очень тяжело найти.
постоянно кажется, что она падает. И из-за этого непреходящего ощущения она действительно не может устоять на ногах. Когда , не имея точки опоры, поднимается с места, в первые мгновения она выглядит так, словно стоит на краю пропасти, в которую вот-вот упадет. Сначала у нее начинает дрожать и склоняться на одну сторону голова, и вытягивает руки, пытаясь зафиксировать свое положение. После этого ее тело принимается хаотично двигаться вперед и назад, и тогда напоминает человека, идущего по туго натянутому канату в тот ужасный момент, когда канатоходец начинает терять равновесие. При этом вы видите, что , на самом деле, стоит на твердой, устойчивой поверхности (на полу, на земле), широко расставив ноги. Создается впечатление, что она боится не столько падения, сколько того, что ее толкнут.」 - 「Семья из Екатеринбурга более 10 лет пытается добиться восстановления вентиляции в квартире
: Место действия: мск, дом 24 этажа. Я на 9-м. Стал замечать, что нет тяги в вентиляции. Пришел в диспетчерскую УК (благо два шага от подъезда), написал заявление на проверку/прочистку. Фабула: Возвращаюсь часов в 8 вечера, в холле подъезда стихийный митинг из человек 7, что мол УК совсем охерели и портят имущество. Вслушиваясь в монолог истерящей дамочки проясняю обстоятельства: разбит холодильник. Далее подробности от УК. УК приняв заявку, отправляет работника на крышу проверить вентканал, (короб в квартире ппц толстый: где то 12050 см по внешним габаритам, и расположен там, где многие ввиду нестандартной планировки, хотели бы установить холодильник) решили прочистить канал привязав обычную 16кг гирю советского производства к тросу начали проход шахты. На высоте примерно 12 - 11 этажа нашли "засор" и начали прочистку, постепенно увеличивая высоту подъёма грузика... Уж не знаю на какую высоту подняли этот грузик, но он прошел "засор" в виде холодильника до середины морозилки. Как итог за самовольную врезку в вент канал "пострадавшей" был влуплен штраф и предписание устранить изменения. Единственное что частично оправдывает "пострадавшую" - она сделала обвод вокруг врезанного холодильника из венттрубы 110мм50мм квадратного сечения, что было явно недостаточно для тяги в таком стояке.」 - 「Космическое производство кристаллов для лазеров. Ключевой вопрос космического производства стоит так. Что в космосе можно делать такого, чтобы оно 1) отбивало стоимость вывода на орбиту и возвращения на Землю груза и 2) оно было массовым, чтобы рынок был достаточно большим? Когда начинают говорить о 3D - печати живой ткани - то, по моим впечатлениям, говорят об этом от отчаяния. Да, с научной точки зрения это очень интересно. Но до того, чтобы что-то такое напечатанное пересаживать живому человеку - мягко говоря ну вот совсем очень далеко. Да, можно печатать ткани нескольких органов на одной площадке, связывать их друг с другом, организовывать обмен веществ, и затем смотреть как какое-нибудь новое лекарство влияет на "экосистему" тканей (а не на каждый вид ткани в отдельности). Но это все штучный товар, бизнес на этом не построить. Что-то более близкое к реальной экономике сделала летом корпорация Redwire. Redwire вырастила на орбите на борту МКС двухграммовый кристалл дигидрофосфата калия (их используют для создания мощных лазеров) и даже продала его - Университету штата Огайо. Компания заявляет, что это первая в истории сделка с товарами, произведенными в космосе. Вот этот кристалл: Кристалл, выращенный Redwire на МКС. Первые попытки выращивания кристаллов на орбите были предприняты в 1970 - х. На фото слева - "земные" кристаллы, а справа - кристаллы, выращенные в космосе в условиях микрогравитации (см. фото ниже). Профессор
приобрел образец, выращенный Redwire за 4000 долларов, что эквивалентно 2 миллионам долларов за килограмм. Сейчас сотрудники университетского центра электронной микроскопии и анализа изучают образец - режут его на тонкие сегменты и изучат его свойства. Redwire ожидает, что анализ покажет, что выращивание кристалла в условиях микрогравитации привело к меньшему количеству дефектов и получению более качественного продукта. https://t.me/IngeniumNotes/622」
- 「Кстати ole72ole я писал уже выше насчёт книги "Пластичность мозга", там в самой первой главе говорится о женщине которая всё время падала и о методах которыми её смогли восстановить. Хорошо бы показать эту книгу его родственникам, чтобы в свою очередь они прочитали и рассказали о методах лечащему врачу. Вот начало этой главы, мне кажется или у вашего сопалатника похожая ситуация только чуть всё иначе? Могу скинуть если напишешь свою почту эту книгу, т.к. на пикабу я не нашёл Личных сообщений, а в свободном доступе (бесплатно) книгу очень тяжело найти.
サンプルケース3
- ソース文:
「Феодосия, 25 декабря. Крыминформ. В Феодосии 67 - летний
объявил голодовку и грозится покончить жизнь самоубийством в связи с тем, что суд не удовлетворил иск о подтверждении факта его постоянного проживания на территории Крыма, что необходимо для приобретения российского гражданства. Он объявил об этом сегодня, выйдя к зданию городского суда с табличкой "Голодовка". "Суд 22 декабря вынес решение, которым не подтверждает факт моего постоянного проживания в Феодосии. Я прописан в Украине, но живу в городе по одному и тому же адресу с 2004 года, работал на заводе, принимаю активное участие в жизни города. Пенсию мне перестали выплачивать, жить не на что, деньги занимаю у соседей", - сообщил . По его словам, на суде давали показания его соседи, а сам он представил подтверждающие документы. Сегодня, как сообщил мужчина, он получил ответ председателя суда , в котором ему предлагают обратиться в апелляционный суд. Однако, по словам , у него нет денег даже на оплату госпошлины. "Мне рекомендовали обратиться в апелляционный суд, но денег на это у меня нет вообще", - сказал он.」 - 比較文:
「17 - 18 января исполнилось два года эпохальному событию: кухонная утварь (кастрюли, дуршлаги и прочее) напрочь вошла в украинскую политику, а понятие «кастрюлеголовые» плотно закрепилось за майданствующими особями незалежной. Напомним, 16 января 2014 года Верховная Рада Украины приняла (а 17 января президент
подписал) пакет законов, которые должны были помочь в борьбе с массовыми беспорядками. Как-то: запрещалось участие в демонстрациях с использованием средств, затрудняющих идентификацию личности, присутствие на митинге с открытым огнем, пиротехникой, оружием, газовыми баллончиками, взрывчаткой и т. п. средствами, а также в камуфляже, масках и касках. Отметим, что практически все принятые тогда законы имели прямые аналоги в законодательстве стран ЕС и США. Но Совет Европы дал им предварительную собственную оценку, по которой многие предлагаемые нормы почему-то не соответствовали Европейской конвенции по правам человека, рекомендовав парламенту либо отменить, либо приостановить их действие в течение значительного периода времени. Адепты «революции гыдности» сразу же окрестили принятые акты «Законами о диктатуре» и массово вышли на Майдан с кастрюлями на головах. К слову, 9 из 12 - ти законов таки были отменены Верховной Радой 28 января 2014 года. Но, увы, кухонная утварь плотно сдавила черепа украинских патриотов: многие до сих пор кастрюли так и не сняли. «Нешуточная дата – день кастрюлеголовых. Есть и те, кто, спустя два года, ничего так и не понял. Поздравляют друг дружку, вспоминают, кто ведро нацепил, кто – дуршлаг, кто – кастрюлю с цветочками. Они и по сей день не сняли с головы кастрюли. Им только кажется, что они их сняли. А на самом деле кастрюли приросли и пустили корни», - пишет блогер . Как сложилась судьба этих кастрюлеголовых идиотов – известно всем. Скачущие холопы стали «незалежнее в...」
Jina Embeddings V3
Jina Embeddings V3 は100以上の言語をサポートする多言語文埋め込みモデルで、文の類似度と特徴抽出タスクに特化しています。
テキスト埋め込み
Transformers 複数言語対応

J
jinaai
3.7M
911
Ms Marco MiniLM L6 V2
Apache-2.0
MS Marcoパッセージランキングタスクで訓練されたクロスエンコーダモデル、情報検索におけるクエリ-パッセージ関連性スコアリング用
テキスト埋め込み 英語
M
cross-encoder
2.5M
86
Opensearch Neural Sparse Encoding Doc V2 Distill
Apache-2.0
蒸留技術に基づくスパース検索モデルで、OpenSearch向けに最適化されており、推論不要のドキュメントエンコーディングをサポートし、検索関連性と効率性においてV1版を上回ります
テキスト埋め込み
Transformers 英語

O
opensearch-project
1.8M
7
Sapbert From PubMedBERT Fulltext
Apache-2.0
PubMedBERTに基づく生物医学エンティティ表現モデルで、自己アライメント事前学習により意味関係の捕捉を最適化します。
テキスト埋め込み 英語
S
cambridgeltl
1.7M
49
Gte Large
MIT
GTE-Largeは強力なセンテンストランスフォーマーモデルで、文の類似度とテキスト埋め込みタスクに特化しており、複数のベンチマークテストで優れた性能を発揮します。
テキスト埋め込み 英語
G
thenlper
1.5M
278
Gte Base En V1.5
Apache-2.0
GTE-base-en-v1.5 は英語の文章変換モデルで、文章類似度タスクに特化しており、複数のテキスト埋め込みベンチマークで優れた性能を発揮します。
テキスト埋め込み
Transformers 複数言語対応

G
Alibaba-NLP
1.5M
63
Gte Multilingual Base
Apache-2.0
GTE Multilingual Base は50以上の言語をサポートする多言語文埋め込みモデルで、文類似度計算などのタスクに適しています。
テキスト埋め込み
Transformers 複数言語対応

G
Alibaba-NLP
1.2M
246
Polybert
polyBERTは、完全に機械駆動の超高速ポリマー情報学を実現するための化学言語モデルです。PSMILES文字列を600次元の密なフィンガープリントにマッピングし、ポリマー化学構造を数値形式で表現します。
テキスト埋め込み
Transformers

P
kuelumbus
1.0M
5
Bert Base Turkish Cased Mean Nli Stsb Tr
Apache-2.0
トルコ語BERTベースの文埋め込みモデルで、意味的類似性タスクに最適化
テキスト埋め込み
Transformers その他

B
emrecan
1.0M
40
GIST Small Embedding V0
MIT
BAAI/bge-small-en-v1.5モデルを微調整したテキスト埋め込みモデルで、MEDIデータセットとMTEB分類タスクデータセットで訓練され、検索タスクのクエリエンコーディング能力を最適化しました。
テキスト埋め込み
Safetensors 英語
G
avsolatorio
945.68k
29
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98