bge-large-en-v1.5-ggufオープンソース埋め込みモデル - llama.cpp用に特別に設計され、CPUとGPUでの実行が高速化

ホーム

Bge Large En V1.5 Gguf

CompendiumLabsによって開発

GGUF形式の量子化および非量子化埋め込みモデルを提供し、llama.cpp専用に設計されています。CPU上で実行すると速度が大幅に向上し、GPU上でも大規模モデルに対して適度な高速化が可能です。

テキスト埋め込みオープンソースライセンス:MIT #英語埋め込みモデル #CPU最適化 #効率的な推論

ダウンロード数 878

リリース時間 : 2/17/2024

モデル概要

これはBAAI/bge-large-en-v1.5モデルを変換したGGUF形式の埋め込みモデルで、llama.cppフレームワークに適しており、性能とリソース使用を最適化するための複数の量子化バージョンを提供します。

モデル特徴

GGUF形式最適化

llama.cpp専用に設計された形式で、CPU上での実行速度が顕著に向上

多重量子化オプション

F32からQ4_K_Mまでの様々な量子化レベルを提供し、精度と性能のバランスを実現

CPU効率的実行

CPU上で最大30%の速度向上を実現可能で、精度損失は極小

モデル能力

テキスト埋め込み

意味的類似度計算

情報検索

使用事例

情報検索

ドキュメント検索

クエリとドキュメントを埋め込みベクトルに変換して類似度マッチング

検索の関連性と効率性の向上

意味分析

テキストクラスタリング

埋め込みベクトルに基づいて類似テキストをグループ化

テキストデータ内の潜在的なパターンやテーマの発見

ファイル名	量子化	サイズ
bge-large-en-v1.5-f32.gguf	F32	1.3 GB
bge-large-en-v1.5-f16.gguf	F16	639 MB
bge-large-en-v1.5-q8_0.gguf	Q8_0	342 MB
bge-large-en-v1.5-q4_k_m.gguf	Q4_K_M	199 MB

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

Bge Large En V1.5 Gguf

モデル概要

モデル特徴

モデル能力

使用事例

🚀 bge-large-en-v1.5-gguf

🚀 クイックスタート

💻 使用例

基本的な使用法

📦 利用可能なファイル

📄 ライセンス