Fine Tuned Movie Retriever Bge Base En V1.5
F
Fine Tuned Movie Retriever Bge Base En V1.5
JJTsaoによって開発
映画やテレビ番組の推薦システムに特化した微調整済みの文変換モデルで、RAGパイプラインにおける高品質なベクトル検索を最適化しています。
ダウンロード数 540
リリース時間 : 5/5/2025
モデル概要
このモデルは、映画推薦のための検索強化生成(RAG)パイプラインに対して最適化されており、豊富な雰囲気スタイルやメタデータに基づく自然言語クエリをサポートし、スマートな負サンプリング戦略を採用しています。
モデル特徴
豊富な雰囲気スタイルクエリのサポート
「愛と犠牲をテーマにした、感情的な宇宙探査映画」のような、映画の雰囲気やスタイルを表す自然言語クエリを理解して処理することができます。
メタデータクエリの最適化
「クインティン・タランティーノが1990年代に監督した、強盗に関する犯罪映画はありますか?」のような、監督、年代、ジャンルなどのメタデータに基づく自然言語クエリを最適化しています。
スマートな負サンプリング
ジャンルの対比、テーマの不一致、スターとテーマの混同など、よりスマートな負サンプリング戦略を採用し、検索品質を向上させています。
大規模な学習データ
約32,000件のメタデータと雰囲気スタイルのプロンプトにまたがる合成自然言語クエリを使用して学習されています。
モデル能力
映画の意味検索
テレビ番組の意味検索
自然言語クエリの理解
ベクトル類似度計算
使用事例
推薦システム
RAGスタイルの映画推薦
検索強化生成パイプラインにおいて、高品質なベクトル検索コンポーネントとして機能します。
Recall@1が0.456に達し、ベースモデルの0.214を大きく上回っています。
映画カタログの意味フィルタリング
大規模な映画カタログに対して、意味に基づくフィルタリングと検索を行います。
クエリ - ドキュメントの再ランキング
検索パイプラインにおいて、クエリとドキュメントの再ランキングに使用されます。
おすすめAIモデル
Llama 3 Typhoon V1.5x 8b Instruct
タイ語専用に設計された80億パラメータの命令モデルで、GPT-3.5-turboに匹敵する性能を持ち、アプリケーションシナリオ、検索拡張生成、制限付き生成、推論タスクを最適化
大規模言語モデル
Transformers 複数言語対応

L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-TinyはSODAデータセットでトレーニングされた超小型対話モデルで、エッジデバイス推論向けに設計されており、体積はCosmo-3Bモデルの約2%です。
対話システム
Transformers 英語

C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
RoBERTaアーキテクチャに基づく中国語抽出型QAモデルで、与えられたテキストから回答を抽出するタスクに適しています。
質問応答システム 中国語
R
uer
2,694
98