G

German Semantic V3

aari1995によって開発
ドイツ語の意味理解に特化した文埋め込みモデルで、可変シーケンス長と入れ子式埋め込みをサポート、2020年以降の知識まで対応
ダウンロード数 1,646
リリース時間 : 6/23/2024

モデル概要

ドイツ語の意味的文埋め込みベクトルを生成するモデルで、文の類似度計算と特徴抽出をサポート

モデル特徴

柔軟性
可変シーケンス長と埋め込み切り捨て学習をサポート、最大8192トークンまで対応
入れ子式埋め込み
1024次元から64次元までの埋め込みサイズをサポート、わずかな品質低下で大幅なストレージ削減が可能
純粋なドイツ語モデル
ドイツ語シナリオに特化し、豊富なドイツ文化知識を含み、専用トークナイザーで短いクエリを効率的に処理
最新知識
gbert-largeモデルを基に、10億のドイツ語finewebトークンで第二段階の事前学習を実施
頑健性
スペルミスや大文字小文字の違いに対する許容能力を強化し、埋め込みの安定性を向上

モデル能力

ドイツ語意味理解
文類似度計算
特徴抽出
長文処理

使用事例

意味検索
政治家検索
政治家に関連する記述を識別
'連邦首相'と'アンゲラ・メルケル'、'オラフ・ショルツ'を正しく関連付け可能
内容理解
ウイルス関連用語
'新型コロナウイルス'と類似語を区別
'新型コロナウイルス'と'ウイルス'、'王冠'、'ビール'を正しく区別可能
行動認識
人間活動認識
人間の活動を記述した文を理解
'男性がボクシングを練習している'と'猿が武術を練習している'などの類似記述を区別可能
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase