R

Rubert Mini Uncased

sergeyzhによって開発
このモデルはロシア語と英語の文の埋め込みベクトルを計算するために使用され、ai-forever/FRIDAの埋め込みベクトルを蒸留して取得されます。モデルはuncasedタイプで、テキスト内の大文字と小文字を区別しません。
ダウンロード数 724
リリース時間 : 3/25/2025

モデル概要

このモデルはロシア語と英語の文の埋め込みベクトルを計算するために使用され、FRIDAの埋め込みベクトルを蒸留して取得されます。埋め込みベクトルのサイズは384、層数は7、コンテキストサイズは512トークンです。モデルはさまざまなプレフィックス機能をサポートして、異なるタスクのパフォーマンスを向上させます。

モデル特徴

多言語サポート
ロシア語と英語の文の埋め込みベクトル計算をサポート
プレフィックス機能
FRIDAから継承したマルチタスクプレフィックス機能で、異なるタスクに対してパフォーマンスを最適化
ミニモデル
軽量設計で、埋め込みベクトルサイズが384、層数が7と、リソースが限られた環境に適している
大文字小文字を区別しない
uncasedタイプで、テキスト内の大文字と小文字を区別しない

モデル能力

文埋め込みベクトルの計算
意味的テキスト類似度計算
言い換え認識
自然言語推論
感情分析
毒性識別

使用事例

テキスト類似度
検索クエリマッチング
search_queryプレフィックスを使用して検索クエリとドキュメントのマッチングを最適化
ruMTEBベンチマークテストでNDCG@10スコアが0.791
言い換え認識
paraphraseプレフィックスを使用して意味的に類似した文を識別
言い換え認識タスクでスコア0.760
テキスト分類
感情分析
categorize_sentimentプレフィックスを使用して感情分類を実行
感情分析タスクでスコア0.798
トピック分類
categorize_topicプレフィックスを使用してトピック分類を実行
タイトル分類タスクで精度0.884
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase