Q

Qwen3 Embedding 0.6B Onnx Uint8

electroglyphによって開発
これはONNXに基づく量子化モデルで、Qwen/Qwen3-Embedding-0.6Bのuint8量子化バージョンであり、検索性能を維持しながらモデルサイズを削減しています。
ダウンロード数 112
リリース時間 : 6/8/2025

モデル概要

このモデルはテキスト埋め込みモデルで、テキストのベクトル表現を生成するために使用され、情報検索や意味検索などのタスクに適しています。

モデル特徴

効率的な量子化
uint8量子化技術を採用し、モデルサイズを大幅に削減しながら、検索性能を維持します。
高性能
完全なf32モデルと比較して、検索性能の差は約1%だけです。
互換性
qdrant fastembedと互換性があり、関連環境でのデプロイと使用が容易です。
最適化された量子化戦略
484個の敏感なノードを量子化から除外することで、モデルサイズと精度のバランスを良好に保ちます。

モデル能力

テキストベクトル化
意味検索
情報検索

使用事例

情報検索
ドキュメント検索
ドキュメントをベクトル表現に変換し、意味に基づくドキュメント検索を実現します。
推薦システム
コンテンツ推薦
コンテンツのベクトル類似度を通じて、パーソナライズされた推薦を実現します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase