bge-small-en-v1.5-ggufオープンソース埋め込みモデル - llama.cpp用に特化設計、CPU処理で大幅な高速化

ホーム

Bge Small En V1.5 Gguf

CompendiumLabsによって開発

GGUF形式の量子化および非量子化埋め込みモデルを提供、llama.cpp専用設計で、transformersよりも優れた性能、CPU上で大幅な高速化を実現

テキスト埋め込みオープンソースライセンス:MIT #英語埋め込みモデル #GGUF量子化 #CPU最適化

ダウンロード数 710

リリース時間 : 2/17/2024

モデル概要

BGE小型英語埋め込みモデルのGGUF形式バージョン、テキスト埋め込みタスクに適し、複数の量子化レベルをサポート

モデル特徴

GGUF形式最適化

llama.cpp専用設計で、元のtransformers実装と比べて顕著な性能向上

多様な量子化オプション

F32からQ4_K_Mまでの複数量化レベルを提供、速度と精度のバランスを考慮

CPU効率的実行

CPU上で最大30%の速度向上を実現、量子化後の精度損失は極小

モデル能力

テキスト埋め込み

意味的類似度計算

情報検索

使用事例

検索と検索

文書類似度検索

文書間の意味的類似度を計算

関連コンテンツを効率的に発見

自然言語処理

意味解析

テキストの意味的表現を抽出

下流NLPタスクに利用

ファイル名	量子化	サイズ
bge-small-en-v1.5-f32.gguf	F32	128 MB
bge-small-en-v1.5-f16.gguf	F16	65 MB
bge-small-en-v1.5-q8_0.gguf	Q8_0	36 MB
bge-small-en-v1.5-q4_k_m.gguf	Q4_K_M	24 MB

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Bge Small En V1.5 Gguf

モデル概要

モデル特徴

モデル能力

使用事例

🚀 bge-small-en-v1.5-gguf

🚀 クイックスタート

✨ 主な機能

📦 利用可能なファイル

💻 使用例

基本的な使用法

📄 ライセンス