1 미국 주식데이터

nasdaq 웹사이트에서 나스닥 뿐만 아니라 NYSE, AMEX 상장사 정보를 가져올 수 있다.

교환소 별로 다운로드 받은 데이터를 하나로 묶어서 현재 거래가 되고 있는 주식 1000개를 뽑아 표로 만들어 본다.

2 거래소 기초분석

2.1 거래소 규모

NYSE, NASDAQ, AMEX 거래소 시가총액을 계산한다. 시가총액은 단위가 너무 커서 Overflow가 발생할 수 있어 상장사별 시가총액을 \(10^6\) 으로 나눠 단위를 백만달러(million dollar)로 변환시킨 후에 상장사와 상장사 시가총액을 모두 합한 후 거래소 비중을 비율로 파악한다.

# A tibble: 3 x 3
  exchange     n pcnt 
  <chr>    <int> <chr>
1 nasdaq    3074 53.1%
2 nyse      2440 42.1%
3 amex       276 4.8% 
# A tibble: 3 x 3
  exchange market_cap pcnt 
  <chr>         <dbl> <chr>
1 amex        111933. 0.3% 
2 nasdaq    12440901. 31.7%
3 nyse      26730270. 68.0%

3 분야별 주식비중

3.1 거래소 상장사수

amex는 상대적으로 비중이 적어 제외하고 분야(sector)별로 상장수가 어떻게 분포되어 있는지 확인한다.

3.2 거래소 시가총액

시가총액을 백만달러로 변환시킨 market_cap_m 변수를 분야(sector)와 조합하여 가장 비중이 많은 분야를 거래소와 교차하여 확인한다.

4 주식 데이터

quantmod 팩키지로부터 관심있는 주식에 대한 주식 종명명 약칭(stock symbol)을 찾아 바로 거래가격을 확인할 수 있다.

4.1 quantmod 헬로월드

quantmod 팩키지를 통해 주식 거래 데이터를 가져올 수 있다. 구글 금융(Google finance)은 2018년 3월 이후 서비스를 중단(Google Finance stopped providing data in March, 2018.)해서 대안으로 야후 금융(yahoo finance)에서 데이터를 가져온다.

quantmod 팩키지 시계열 데이터는 OHLC (Open, Hi, Lo and Close)를 담고 있기 때문에 다음 두가지 방식으로 데이터를 가져와서 분석에 사용할 수 있다.

[1] "AAPL"
           AAPL.Close
2018-01-02     172.26
2018-01-03     172.23
2018-01-04     173.03
2018-01-05     175.00
2018-01-08     174.35
2018-01-09     174.33
           AAPL.Close
2018-01-02     172.26
2018-01-03     172.23
2018-01-04     173.03
2018-01-05     175.00
2018-01-08     174.35
2018-01-09     174.33

4.2 기술 섹터 상위 5사

기술 섹터(Sector) 시가총액 비중이 높은 회사 5개를 추출하여 ggplot()으로 시각화한다. 이를 위해서 다음 단계를 거친다.

  1. 상장사 목록에서 기술 섹터를 추출하여 시가총액 5개사를 추출한다.
  2. quantmod 팩키지에서 getSymbols() 함수로 “2010-01-01” 부터 최근까지 주가데이터를 가져온다.
  3. zoo 자료형을 데이터프레임으로 변환시킨다.
  4. ggplot() 그래프로 시각화한다.