1 인스타그램 개요 1

인스타그램(Instagram)은 온라인 사진 공유 및 소셜 네트워킹 서비스로, 사용자들은 인스타그램을 통해 사진 촬영과 동시에 다양한 디지털 필터(효과)를 적용하며 페이스북이나 트위터등 다양한 소셜 네트워킹 서비스에 사진을 공유할 수 있는데, 인스타그램의 가장 큰 특징은 정사각형의 사진이며 보통의 모바일 기기에서 사용하는 16:9 비율과 다르다.

2 데이터 가져오기

instaR 팩키지와 몇가지 실험적인 R 팩키지가 개발되었으나 잦은 API 정책 변경 등으로 인하여 Instagram Crawler를 사용하여 데이터를 얻는 것도 좋은 방법이다.

2.1 설치방법

  1. 크롬(Chrome) 브라우저 설치를 확인한다.
  2. instagram-crawler을 다운로드 받아 적당한 디렉토리에 설치한다.
  3. chromedriver를 다운로드 받아 ./inscrawler/bin/chromedriver에 넣어둔다.
    • 즉, instagram-crawler\inscrawler\bin\chromedriver.exe
  4. 셀레리움(Selenium) 설치한다.
    • pip install -r requirements.txt
  5. 마지막, 파일명 변경한다.
    • cp inscrawler/secret.py.dist inscrawler/secret.py

3 탐색적 데이터분석

인스타그램 작업흐름

인스타그램 작업흐름

원본데이터가 .json으로 저장되어 있어 이를 텍스트 편집기에서 보는 것은 다소 불편할 수 있다. 이를 보완하기 위해서 http://www.jsonparseronline.com/ 웹사이트에서 보기 편한 형태로 자료형에 대한 기본적인 방향성에 대한 감을 얻을 수 있다.

3.1 프로파일

profile.json 파일을 가져와서 기본적인 계정(777byung)에 대한 정보를 얻어온다.