G

Granite Embedding 107m Multilingual GGUF

bartowskiによって開発
IBM Graniteチームによって開発された多言語埋め込みモデルの量子化バージョンで、17種類の言語のテキスト埋め込みタスクをサポートし、検索や情報抽出などのシナリオに適しています。
ダウンロード数 15.19k
リリース時間 : 12/18/2024

モデル概要

このモデルは107Mパラメータの軽量な多言語埋め込みモデルで、llama.cppツールを使って量子化すると、リソースが制限された環境でも高効率に動作します。特にトークナイザーを最適化し、複数の量子化形式を選択できます。

モデル特徴

多言語サポート
英語、中国語、アラビア語などの主要な言語を含む17種類の言語のテキスト埋め込みをサポートします。
量子化最適化
f16からIQ3_Mまでの15種類の量子化バージョンを提供し、デバイスの性能に合わせて最適なバランスを選択できます。
軽量高効率
たった107Mパラメータで、量子化後の最小バージョンはわずか0.12GBで、モバイル端末やエッジデバイスに適しています。
検索最適化
MIRACL多言語検索ベンチマークテストで優れた性能を発揮し、特にテルグ語(te)とタイ語(th)に強いです。

モデル能力

多言語テキスト埋め込み
異言語情報検索
意味的類似度計算
低リソース環境でのデプロイ

使用事例

情報検索
多言語ドキュメント検索
17種類の言語をサポートするドキュメント検索システムを構築します。
テルグ語のテストセットでndcg@10=0.78175に達しました。
異言語コンテンツ推薦
ユーザーの母国語に基づいて関連する外国語コンテンツを推薦します。
中国語から英語への異言語検索のrecall@100は0.87388に達しました。
意味分析
多言語クラスタリング分析
混合言語のコンテンツを意味的にクラスタリングします。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase