German Semantic V3b
ドイツ語の意味理解に特化したSentence-Transformerモデルで、可変シーケンス長と入れ子式埋め込みをサポートし、ドイツ語シナリオで優れた性能を発揮
ダウンロード数 1,763
リリース時間 : 6/15/2024
モデル概要
このモデルはGerman_Semantic_STS_V2のアップグレード版で、ドイツ語の意味的類似度計算と特徴抽出に特化し、特にドイツ文化の理解とスペルミス許容能力を最適化
モデル特徴
可変シーケンス長
最大8192トークンの埋め込み処理をサポートし、前世代モデルの16倍の容量
入れ子式埋め込み
1024から64までの複数の埋め込みサイズをサポートし、品質低下を最小限に抑えつつ大幅なストレージ削減を実現
スペルミス許容
スペルミスや大文字小文字の違いに対する頑健性を強化し、実用性の安定性を向上
ドイツ文化理解
ドイツ語シナリオに特化し、ドイツ文化知識を豊富に含み、専用トークナイザーで短いクエリを効率的に処理
柔軟なプーリング方式
CLSマーカーを用いたプーリング方式を採用し、第二段階の事前学習後に学習効果がより優れる
モデル能力
ドイツ語意味的類似度計算
ドイツ語テキスト特徴抽出
ドイツ語文章埋め込み生成
ドイツ語テキストマッチング
使用事例
テキスト類似度
意味検索
ドイツ語文書やQ&Aシステムの意味検索機能に使用
意味的に類似しているが表現が異なるドイツ語文章を正確にマッチング
重複コンテンツ検出
表現は異なるが意味が同じドイツ語コンテンツを識別
コンテンツ重複率を効果的に低減
情報検索
文書クラスタリング
ドイツ語文書を意味的にクラスタリング
文書整理効率を向上
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98