train_test_split (1) 썸네일형 리스트형 [혼자공부하는머신러닝+딥러닝] Ch.02 데이터 다루기 / 훈련-테스트 세트 분리, 전처리 본 포스팅은 저를 포함한 책을 구입한 분들의 학습 정리를 위해 쓰여졌습니다. 02-1 훈련세트와 테스트 세트 머신러닝은 입력과 타깃값을 주고 미리 훈련한 다음, 기존 훈련에 쓰이지 같은 형태의 데이터로 테스트하는 형태로 평가한다. 즉, 훈련과 테스트는 서로 다른 데이터 값으로 나누어주어야한다. 이렇게 연습문제와 시험문제가 달라야 머신러닝의 알고리즘 평가가 가능하다. 이런 형태를 만드는 방법은 평가를 위한 또 다른 데이터를 준비하거나 이미 준비된 데이터 중에서 일부를 떼어 내 활용하는 것이다. 앞서 본 그림과 같다. 데이터를 분리해 학습용과 테스트용을 분리한다. 데이터를 분리하는 방법은 1. 데이터에 index와 slicing 연산자를 이용 2. numpy라이브러리의 arrange() 함수 이용 2. sc.. 이전 1 다음