데이터 (사이언스) 공학

데이터 과학(Data Science)이라는 말이 회자된지는 몇년이 되지 않았지만, 인공지능(AI)과 함께 현재 가장 많이 회자되고 있는 단어가 되었다. 앞서 데이터 사이언스 입문 교육과정에서 학습한 것을 바탕으로 다양한 분야에서 다뤄지는 데이터를 가져오고, 탐색적으로 분석하고, 가설을 세우고, 모형을 제작하고 의사결정권자와 커뮤니케이션을 하거나 제품과 서비스를 만들어 배포하는 기술을 습득한다. 기본 데이터 사이언스 언어로 R파이썬을 함께 사용한다. 이를 통해서 4차 산업혁명의 원재료인 데이터를 가지고 사회경제적 가치가 있는 제품과 서비스를 개발할 수 있는 역량을 갖추게 되어 데이터를 자신감을 갖고 바라보게 된다.

선수과목

이번 수업에 선수과목이 필요하지만, 공개된 데이터를 바탕으로 차근차근 배워간다는 열정과 열린 마음이 중요합니다. 데이터 사이언스 입문 교육과정을 이수하지 않는 경우 학습량이 많을 수가 있으니 수업전에 시간을 별도로 내서 데이터 사이언스 입문 교육과정을 충실히 학습한다. 여기에는 초등학생이 많이 배우는 컴퓨터 과학 언플러그드, 중고생들에게 관심이 많은 파이썬 계열의 리보그 - 프로그래밍과 문제해결, 파이썬 거북이, 정보과학을 위한 파이썬을 수업 전 읽어두면 도움이 많이 될 것이다. 또한, 소프트웨어 카펜트리 5.3 및 최근 있었던 소프트웨어 카펜트리 한림대학교 워크샵 교재를 숙독하면 도움이 많이 될 수 있다. 데이터 사이언스 입문과 달리 중급 이상의 파이썬 이해가 필요하기 때문에 모두를 위한 파이썬을 선행학습해 둘 것을 권장한다.

인터랙티브 강의노트

특강 안내

프로젝트

Schedule

Setup Download files required for the lesson
00:00 1. 데이터 사이언스 언어
∽̱ 9월6일
데이터 사이언스란?
가장 적합한 데이터 사이언스 언어는?
어떻게 데이터 사이언스를 배울 것인가?
03:00 2. [언어] R
∽̱ 9월20일
언어와 팩키지 차이점은 무엇인가?
왜 데이터 사이언스에 R 언어를 사용할까?
다양한 R 구문(syntax)가 존재하는 이유는 무엇인가?
06:00 3. [언어] 파이썬
∽̱ 9월27일
라즈베리파이 4가 나왔는데 흥분되지 않습니까?
데이터 사이언스 언어로 파이썬의 강점이 무엇을까요?
R마크다운과 쥬피터 노트북 누구를 더 사랑하시나요?
09:00 4. [언어] API 프로그래밍
∽̱ 10월4일
API란 무엇인가?
왜 API를 사용할까?
함수, 메쏘드, 팩키지, API를 구분할 수 있는가?
12:00 5. 데이터 사이언스 자료구조
∽̱ 10월11일
데이터 과학자가 알아야 되는 자료구조는?
15:00 6. [자료구조] 시계열 데이터
∽̱ 10월18일
도대체 시계열 데이터란 무엇인가?
시계열 데이터를 표현하는데 필요한 것은 무엇일까?
시계열 데이터가 직사각형 데이터와 다른 점은 무엇인가?
18:00 7. 중간고사
∽̱ 10월25일
21:00 8. [자료구조] 지리 공간 데이터
∽̱ 11월01일
지도 공간 데이터란 무엇인가?
데이터프레임을 지도위에 표현하는데 필요한 것은 무엇일까?
공간을 이해하기 위해 필요한 지식은?
24:00 9. [자료구조] NLP - 텍스트 마이닝(R)
∽̱ 11월08일
텍스트 데이터는 어떻게 처리할까?
데이터로 텍스트를 어떻게 이해시킬 수 있을까?
텍스트 데이터를 분석하고 모형을 만든다는 것은 어떤 의미를 갖는가?
27:00 10. [자료구조] NLP - 파이썬
∽̱ 11월15일
어떻게 기계는 자연어를 이해할까?
정규표현식이 그래도 필요할까?
기계가 문서를 자동처리한다는 의미는 무엇인가?
30:00 11. 빅데이터 시각화
∽̱ 11월22일
왜 데이터를 시각화하는가?
데이터 시각화에 필수적인 지식은 무엇일까?
어떻게 데이터 시각화 산출물을 제품화할 수 있을까?
33:00 12. 기계학습 - 예측모형
∽̱ 11월29일
기계학습과 예측모형은 차이점은 무엇인가?
예측한다는 것은 무엇인가?
예측모형은 정말 정확한 것인가?
예측을 구체화하면, 예측유형에는 어떤 것이 포함될까?
36:00 13. DevOps - 도커, HPC, 스파크
∽̱ 12월06일
도커라? 무엇인가?
HPC는 스파크는? 들어보셨나요?
DevOps, 클라우드를 설명해 주시겠어요?
39:00 14. 제품화
∽̱ 12월13일
데이터 사이언스 제품이란 무엇인가?
데이터 사이언스 제품이 왜 필요할까?
어떻게 데이터 사이언스 제품을 제작할 수 있을까?
42:00 15. 기말고사
∽̱ 12월20일
45:00 Finish

The actual schedule may vary slightly depending on the topics and exercises chosen by the instructor.