xwMOOC 기계학습

데이터 과학자가 바라본 기계학습

기계와의 경쟁을 준비하며…

“The future is here, it’s just not evenly distributed yet.”
- William Gibson

학습 목차

  1. 환경설정
    1. 명령라인 데이터 분석 맛보기
      1. 대용량 데이터 표본추출
    2. 파이썬기반 기계학습 툴체인(toolchain): 파이썬 기계학습 생태계
    3. 기계학습 (순수한) 맛보기: 전통적인 통계모형 개발과정 맛보기
  2. 기계학습 지도와 통계모형
    1. 3가지 기계학습 원리
      1. (사업) 문제의 정의
      2. 데이터(Data)
      3. 데이터를 통한 문제풀이 과정
    2. 테스트 주도 기계학습
    3. 기계학습 알고리즘
      1. 나무기반 기계학습모형
      2. 기계학습 예측모형 준비
    4. R 예측모형 안쪽
    5. 데이터 전처리
      1. 예측모형 적용을 위한 전처리
      2. 데이터 전처리 및 정제(파이썬)
      3. 클래스 불균형(Class imbalance)
    6. 탐색적 데이터 분석(EDA)
      1. 범주형 변수와 표
      2. 텍스트 콘솔기반 탐색적 데이터 분석(EDA)
      3. 단변량/다변량 이상점 검출 - anomaly 탐지
      4. 단변량/다변량 이상점 검출 - 사기 탐지
      5. 차원축소 - 포켓몬
      6. 군집분석(Clustering) - 포켓몬
    7. 알고리즘 성능평가
  3. 기계학습 운영 및 자동화 - 파이프라인
    1. 빅데이터 - AWS
    2. 데이터에 무게를 둔 예측모형
      1. 인간 중심 기계학습 모형
        1. 선형대수와 함께하는 회귀분석 이해
        2. 통계적 모형개발 기초
        3. 전통방식 모형개발 -타이타닉 생존데이터
      2. 인간과 기계가 함께하는 기계학습 예측모형
        1. 기계학습 예측모형 실습
        2. 모형식별 및 선택
        3. 회귀모형 → caret → 스파크 → \(H_2 O\) - 1부
        4. 회귀모형 → caret → 스파크 → \(H_2 O\) - 2부
        5. 사례 - 도요타 중고차 가격 예측
        6. 사례 - 콘크리트 강도
        7. 사례 - 카드발급
        8. 사례 - 기계고장 빈도수 예측
      3. 기계 중심 기계학습
  4. 데이터 유형별 기계학습 모형
    1. 네트워크 데이터: 보다 심화된 네트워크 데이터에 대한 분석을 위해 별도 저장소로 2017-12월 이동.
    2. 텍스트 데이터: 보다 심화된 네트워크 데이터에 대한 분석을 위해 별도 저장소로 2018-01월 이동.
    3. 공간정보 데이터
    4. 시각 데이터
    5. 장바구니 데이터 분석
  5. 기계학습 상용화
    1. 기계학습 - 기술부채(Technical Debt)
    2. 보스턴 집값예측 - 주성분 회귀
    3. 신용평점모형 개발
      1. 신용평점모형 탐색적 데이터 분석, 전처리
      2. 신용평점모형 - 로지스틱 회귀모형과 의사결정나무
      3. 신용평가와 신용평점모형
      4. 소매금융 부도예측 - 독일신용 데이터
    4. 랜딩클럽 - 채무불이행 예측모형
    5. 마케팅
      1. 마케팅 반응 예측모형
      2. 마케팅 - RFM 및 응용분야
    6. 고객 이탈(churn)
      1. 데이터 위생처리(sanitize)
      2. 고객 이탈(churn): 탐색적 데이터 분석(EDA)
      3. 고객 이탈(churn) 예측모형
      4. 생존분석(Survival Analysis)
    7. 지방선거 광역단체장 지지율 예측모형
    8. 보험금 청구(insurance claim) 사기 예측(fraud detection)

기계학습 관련 정보 1

xwMOOC 오픈 교재