빅4 회계법인에 대해 자세히 살펴보자
빅4 회계법인 및 중소 회계법인 결산분석이 조세일보에 나름 자세히 정리되어 있다.
한국 금융감독원에서 운영하는 다트(Dart) 시스템 크롤링을 위한 라이브러리가 파이썬으로 공개되어 있다. 이를 위해서 OPEN DART에서 인증키를 발급받아 파이썬 라이브러리인 dart-fss
를 사용해서 회계법인 재무제표를 가져온다.
library(tidyverse)
library(httr)
library(rvest)
Sys.setlocale("LC_ALL", "C")
pwc_url <- 'http://dart.fss.or.kr/dsaf001/main.do?rcpNo=20190905000354'
req <- GET(pwc_url)
pwc_df <- req %>%
read_html() %>%
html_nodes(xpath = '/html/body/table[4]') %>%
html_table(fill=TRUE)
Sys.setlocale("LC_ALL", "Korean")
pwc_df
dart-fss
파이썬# 다트 파이썬 라이브러리
import dart_fss as dart
# 인증키
api_key='XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'
dart.set_api_key(api_key=api_key)
# 빅4 이름으로 찾기 ( 리스트 반환 )
corp_list = dart.get_corp_list()
samsung = corp_list.find_by_corp_name('삼성전자', exactly=True)[0]
pwc = corp_list.find_by_corp_name('삼일회계법인', exactly=True)[0]
kpmg = corp_list.find_by_corp_name('삼정회계법인', exactly=True)[0]
ey = corp_list.find_by_corp_name('한영회계법인', exactly=True)[0]
deloitte = corp_list.find_by_corp_name('안진회계법인', exactly=True)[0]
# 빅4 재무제표
samsung_fs = samsung.extract_fs(bgn_de='20180101')
samsung_fs['is']
# 저장
filename = 'samsung'
path = 'c:/docs/viz/data/dart'
samsung_fs.save(path=path)