BAAI-bge-m3-int8オープンソースモデル - 密な検索に適し、Vespaとの互換性を最適化

ホーム

BAAI Bge M3 Int8

libryo-aiによって開発

BAAI/bge-m3のONNX INT8量子化バージョンで、密集検索タスクに適しており、Vespa Embeddingとの互換性を最適化しています。

テキスト埋め込み

Transformers

オープンソースライセンス:MIT #密集検索の最適化 #INT8量子化 #低リソースデプロイ

ダウンロード数 1,007

リリース時間 : 6/11/2024

モデル概要

このモデルはBAAI/bge-m3の量子化バージョンで、主にテキスト埋め込みと密集検索タスクに使用され、INT8量子化により推論効率が向上しています。

モデル特徴

INT8量子化

INT8量子化技術を使用してモデルを最適化し、推論速度を向上させ、メモリ使用量を削減します。

Vespa Embedding互換

Vespa Embeddingとの連携に特化して最適化されており、大規模検索シナリオに適しています。

高効率推論

ONNX Runtimeを使用して量子化を行い、AVX - 512 VNNI命令セットをサポートし、計算効率を向上させます。

モデル能力

テキスト埋め込み

密集検索

使用事例

情報検索

意味検索

効率的な意味検索エンジンを構築するために使用され、検索結果の関連性を向上させます。

推薦システム

コンテンツ推薦

テキスト埋め込み技術を通じて、コンテンツの類似度に基づく推薦システムを実現します。

おすすめAIモデル

Llama 3 Typhoon V1.5x 8b Instruct

タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化

Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2％です。

Roberta Base Chinese Extractive Qa

RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。

質問応答システム中国語

uer

2,694

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

BAAI Bge M3 Int8

モデル概要

モデル特徴

モデル能力

使用事例

🚀 [BAAI/bge-m3] ONNX int8形式モデル

🚀 クイックスタート

✨ 主な機能

💻 使用例

基本的な使用法

高度な使用法

📄 ライセンス

🔖 著作権表示