
강의 대상

머신러닝 프로세스

- 문제 정의
- 해당 프로세스를 통해 얻고자 하는 결과가 무엇인지 정의
- 데이터 정의
- 앞에서 정의한 문제를 해결하기 위해 어떠한 알고리즘을 사용할 거고 그 알고리즘에 맞는 형태로 데이터를 변환시키는 작업
- 학습 단계에서 어떠한 알고리즘을 사용할 것인가에 따라 전처리 해야하는 방법이 달라진다.
- ex) 결측지, 이상지 처리, 텍스트 데이터 임베딩, 범주형 데이터 → 다른 형태로 변환
- 학습
- 전처리된 데이터를 입력으로 받아 사전에 선택한 알고리즘에 값을 넣어 학습시킨다.
- 결과가 좋지 않다면, 학습 시 사용했던 파라미터 값들을 튜닝한다. ( 하이퍼 파라미터 튜닝)
- 하이퍼 파라미터를 튜닝한 값을 가지고 모델을 재학습시킴으로써 평가 지표의 성능을 개선할 수 있다.
- 준비한 데이터에 문제가 있어 성능이 좋지 않을 것일 수 있다.
그때는 데이터 전처리 활동인 피처 엔지니어링을 통해 학습 성능을 높이는 피처를 생성을 추가로 진행한다.
- 평가
- 내가 가지고 있는 데이터, 적용할 도메인에 알맞은 평가 방법을 적용하는 것도 중요하다.
- 적절한 평가 지표 선정은 굉장히 어려우면서 중요한 과제이다.
인공지능 로드맵
