본문 바로가기
컴퓨터 활용/통계와 데이터과학

아나콘다 가상환경 구축, 데이콘 경진대회 1등 솔루션 Ch04

by easyfly 2022. 4. 8.
반응형

아나콘다 가상환경 구축

아나콘다 설치

아나콘다 홈페이지에서 설치 파일을 내려받아 설치합니다. 설치 후에 아나콘다 네비게이터를 실행하면 다음과 같은 아나콘다로 할 수 있는 각종 툴들이 나타납니다. 가상환경을 구축하기 위해서 'Powershell Prompt'를 엽니다.

아나콘다 네비게이터

가상환경 구축

아나콘다 프롬프트를 통해 프로젝트를 진행할 가상환경을 구축합니다. 아나콘다 프롬프트를 열고 'store_amount_prediction'이라는 이름이 가상환경을 생성합니다. Python은 3.7버전으로 설정합니다. 명령어는 아래와 같습니다.
>conda create -n store_amount_prediction python=3.7

가상환경 구축

구축된 가상환경을 활성화합니다.
>conda activate store_amount_prediction

가상환경 활성화

주피터 노트북 설치

아나콘다 base 환경에서는 주피터 노트북이 설치되어 있습니다. 하지만 새 가상환경에는 주피터 노트북을 설치해야 합니다.
>conda install jupyter notebook

주피터 노트북 설치
가상환경에 주피터 노트북 설치 성공

주피터 노트북을 설치하면 아나콘다 프롬프트 창에서 ipython을 실행할 수 있습니다. 또한 웹브라우저에서 코드를 작성할 수 있는 환경도 제공됩니다.

주피터 노트북 실행
웹브라우저에 올라온 주피터 노트북
웹브라우저에서 새 노트 시작

파이썬에서 R 객체 사용

파이썬에서 R 개체를 사용하기 위해서는 rpy2 모듈을 설치해야 합니다. 시계열 모델링을 할 때 R의 forecast, forecastHybrid 패키지를 사용합니다. 아나콘다 프로프트를 열고 'rpy2 2.9.4 버전'을 설치합니다. rpy2는 pip로 설치하면 오류가 발생하므로 'conda install' 명령어를 통해 설치합니다.
>conda install -c r rpy2==2.9.4

rpy2 설치

rpy2를 최종적으로 사용하기 위해서는 tzlocal 패키지를 추가로 설치해야 합니다. tzlocal 패키지는 유닉스 및 윈도우에서 현지 시간대 정보와 함께 tzinfo 객체를 반환해 주는 패키지입니다.
>pip install tzlocal

tzlocal 설치

rpy2 설치 확인

ipython 셸을 실행해 rpy2가 정상적으로 설치됐는지 확인합니다.
>ipython

rpy2 설치 성공 확인

pandas 설치

파이썬에서 데이터 처리를 위해 제공하는 대표적인 라이브러리는 판다스입니다. 판다스에서는 시리즈, 데이터프레임, 패널 등 3가지 데이터 구조를 사용합니다. 이러한 판다스의 데이터 구조를 R 객체로 변환할 때 판다스 1.0.0 이상의 버전에서는 호환이 안됩니다. 따라서 'pandas 0.25.1' 버전을 설치합니다. 판다스를 설치한 후 넘파이를 같이 설치합니다. 넘파이는 파이썬에서 행렬 연산을 위해 제공하는 대표적인 라이브러리입니다. 현대 판다스 버전과 호환이 되는 'numpy 1.19.1' 버전을 설치합니다.

판다스 0.25.1 버전 설치
넘파이 1.19.1 버전 설치 성공

판다스와 넘파이 설치 확인

판다스와 넘파이 임포트 성공

파이썬에서 시계열 분석(pmdarima)

pmdarima는 파이썬에서 시계열 데이터를 분석하기 위한 패키지입니다. 기존에 R에서만 이용할 수 있었던 시계열 분석 방법론인 auto_arima를 파이썬에서도 이용할 수 있습니다.
>pip install pmdarima==1.5.3

pmdarima 설치
pmdarima 설치 성공

statsmodels(통계 분석)

statsmodels는 검정 및 추정, 회귀분석, 시계열 데이터 분석 등의 다양한 통계 분석 기능을 제공하는 파이썬 패키지입니다. 기존에 R에서만 가능했던 회귀분석과 시계열 분석 방법을 파이썬에서 사용하기 위해서 설치합니다.
>pip install statsmodels==0.11.1

seaborn, tqdm 패키지 설치

seaborn은 데이터 시각화 패키지이며, tqdm은 파이썬에서 진행 표시 바를 제공해주는 패키지입니다. 이후 반복문을 실행할 때 수행시간을 체크하기 위해 설치합니다.
>pip install seaborn==0.11.0
>pip install tqdm==4.51.0

주피터 노트북에 가상환경 커널 추가하기

가상환경을 활성화하고 필요한 패키지를 모두 설치했습니다. 이제 주피터 노트북에 가상환경 커널을 추가합니다.
>python -n ipykernel install --user --name store_amount_prediction --display-name "[store_amount_prediction]"
name 인자 뒤에는 가상환경 이름을 설정합니다. 또한, display-name 인자에는 주피터 노트북에 보여질 이름을 설정합니다.

주피터 노트북 실행

이제 주피터 노트북을 실행합니다.
>jupyter notebook

주피터노트북 실행 화면
반응형

댓글