問題
あるECサイトの購買履歴データ(PURCHASE_HISTORY)から、アソシエーション分析に必要な3つの指標を求めて、商品の組合せ毎に一覧で表示しなさい。商品の組合せは、商品Aと商品Bの2種類の組合せのみとし、また、購買履歴データには、各会員コードの購入履歴は1セッションIDのみ存在するものとする。
アソシエーション分析とは、顧客の購買履歴などから行動パターンを分析する手法のことで、「データマイニング」の1分野である「相関ルール抽出」の代表的な手法のひとつである。有名なものに「おむつとビール」の事例がある。
アソシエーション分析では、以下の3つの指標を使って分析する。
「支持度(Support)」:すべての購買データのうち、商品Aと商品Bが購買された割合を表す
「信頼度(Confidence)」:商品Aを買った人のうち、商品Bも同時に購買した人の割合を表す
「リフト値(Lift)」:すべての購買データのうち、商品Aがあることで、商品Bの購買率がどのくらい引き上げられているかを表す
リフト値が高いほど、商品Aがあることで商品Bも購買されたという相関関係が強いと評価できる。
指標の計算方法(※指標の計算結果は、小数点第6位を四捨五入すること)
- 支持度 = 商品Aと商品Bを購買した顧客数 ÷ 全顧客数 × 100
- 信頼度 = 商品Aと商品Bを購買した顧客数 ÷ 商品Aを購買した顧客数 × 100
- リフト値 = (商品Aと商品Bを購買した顧客数 ÷ 商品Aを購買した顧客数) ÷ (商品Bを購買した顧客数÷全顧客数)
表示項目は以下とする。(エイリアスを使用し→の項目名とする)
- 商品Aの商品コード → ITEM_A
- 商品Bの商品コード → ITEM_B
- 算出した支持度 → SUPPORT
- 算出した信頼度 → CONFIDENCE
- 算出したリフト値 → LIFT
表示順
- 算出したリフト値の降順
- 算出した支持度の降順
- 算出した信頼度値の降順
- 商品Aの商品コードの降順
表示フォーマット
※あくまでフォーマットを示すもので、正解例ではありません。行数も正解とは異なります。
ER図 (半角:物理名、全角:論理名)
テーブル定義
テーブル名: PURCHASE_HISTORY
サンプルデータ
テーブル名: PURCHASE_HISTORY