목록apriori (1)
차밍이
[R] 연관 분석 Association analysis 과 Pruning
연관분석이란 대용량의 트렌젝션 데이터로부터X이면 Y이다 형식의 연관 관계를 발견하여 분석하는 기법이다. 데이터의 발생 빈도에 따라서 각 데이터 간의 연관관계를 알아보는 방법이다. 장바구니 분석을 예로 기저귀를 샀을 때 맥주를 사는 경우가 많더라 라는 경우를 들 수 있다. 연관규칙의 대표적인 알고리즘으로 1. Apriori algorithm, 2. DHP Algorithm, 3. FP-growth Algorithm 트랜잭션(transaction) 이란? 기업의 상품의 구매 또는 일련의 거래와 같은 사건들을 트랜잭션(transaction) 이라고 한다. 대형마트에 방문하여 물건을 구입하는 손님들중 손님 한명이 산 물품을 트랜잭션 이라고 한다. 대형마트는 데이터베이스를 구축하고 있으며, 수많은 트랜잭션들을 분..
R/데이터 사이언스
2020. 2. 6. 18:09