어제는 무지성으로 돌격했다면, 오늘은 다른 참가자분의 코드를 참고해서 공부를 진행했다. 오늘 배운 점들을 나열해보면 변수에 대해 생각해보고, 파생 변수를 만들었다. 이전에 나는 결측치, 이상치 데이터들을 시각화를 통해 발견하고, 수정은 해봤었지만, 이 분처럼 파생 변수를 만든적은 없었다. 이 프로젝트에서 확인한 파생변수의 예로는 Ground Living Area 는 땅 위에 있는 전체 면적을 의미한다. 1st Flrr Square Feet 는 1층 면적을 의미한다. 만약 Gr Liv Area - 1st Flr SF > 0 이라면 최소 2층이상이라는 의미다. 따라서 2층의 존재여부와 2층이상의면적 이라는 2가지 파생 변수가 생긴다. 데이터분석을 하면서 느끼는건 웬만하면 변수가 많을수록 지표가 좋게 나온다...