머신러닝 및 딥러닝 알고리즘 트레이딩, 파이토치 1.4 사용법

자동매매 시스템 구축은 금융 시장에서 점점 더 중요해지고 있습니다. 그 중에서도 머신러닝 및 딥러닝 알고리즘은 데이터에서 패턴을 발견하고, 이를 기반으로 의사결정을 지원하는 강력한 도구로 자리잡고 있습니다. 이번 글에서는 파이토치 1.4를 활용하여 알고리즘 트레이딩을 구현하는 방법에 대해 상세히 설명하겠습니다.

1. 머신러닝과 딥러닝의 이해

머신러닝은 데이터로부터 학습하여 예측 또는 분류 작업을 수행하는 기술입니다. 딥러닝은 머신러닝의 하위 집합으로, 인공신경망을 이용한 복잡한 모델링이 가능합니다. 최근 몇 년 동안 금융 시장에서 딥러닝이 주목받는 이유는 대량의 데이터를 처리하고, 비선형 관계를 탐지하는 데 효과적이기 때문입니다.

1.1 머신러닝의 기본 개념

머신러닝은 관찰한 데이터를 통해 행동을 학습하는 시스템입니다. 우리는 주어진 입력(X)와 출력(Y) 간의 관계를 모델링하고, 새로운 입력에 대해 예측을 생성합니다. 머신러닝 모델은 크게 세 가지로 분류할 수 있습니다:

지도 학습 (Supervised Learning) : 레이블된 데이터를 사용하여 학습합니다. 예를 들어, 가격 예측을 위한 역사적 데이터와 매매 신호를 기반으로 모델을 훈련합니다.
비지도 학습 (Unsupervised Learning) : 레이블이 없는 데이터를 사용합니다. 클러스터링과 같은 기술을 이용하여 데이터를 분석하고 패턴을 발견합니다.
강화 학습 (Reinforcement Learning) : 에이전트가 환경과 상호작용하며 최적의 행동을 학습합니다. 주식의 매도 및 매수 신호를 결정하는 데 사용될 수 있습니다.

1.2 딥러닝의 발전

딥러닝 모델은 층(Layer)으로 구성되어 있으며, 각 층은 입력 데이터를 변환하여 최종 출력을 생성합니다. 심층 신경망(Deep Neural Networks, DNN)은 이러한 규칙을 기반으로 하며, CNN(Convolutional Neural Networks)과 RNN(Recurrent Neural Networks)와 같은 다양한 아키텍처가 존재합니다.

2. 파이토치 1.4 소개

파이토치는 페이스북이 개발한 오픈소스 머신러닝 라이브러리로, 특히 딥러닝 모델을 최적화하고 구축하기 위해 설계되었습니다. 직관적인 문법과 동적 계산 그래프로 인해 데이터 과학자와 연구자들에게 인기가 높습니다.

2.1 파이토치 설치

파이토치를 설치하려면, 파이썬과 pip가 필요합니다. 다음 명령어로 파이토치를 설치할 수 있습니다:

pip install torch==1.4.0 torchvision==0.5.0

이제 파이토치를 활용한 머신러닝 프로젝트를 시작할 준비가 되었습니다.

3. 데이터 수집 및 전처리

자동매매 시스템에 필요한 데이터는 여러 출처에서 수집할 수 있습니다. Yahoo Finance API, Alpha Vantage, Quandl 등의 API를 이용하면 주식 데이터를 쉽게 가져올 수 있습니다.

3.1 데이터 수집

예를 들어, yfinance 라이브러리를 사용하여 특정 주식의 데이터를 수집하는 방법은 다음과 같습니다:

import yfinance as yf

stock_data = yf.download("AAPL", start="2020-01-01", end="2023-01-01")

3.2 데이터 전처리

수집한 데이터는 종종 결측치가 포함되어 있으므로, 이를 처리해야 합니다. Pandas 라이브러리를 활용하여 데이터프레임을 조작하고 결측치를 처리할 수 있습니다.

import pandas as pd

stock_data = stock_data.fillna(method='ffill')

4. 특징 선택 및 모델 구축

특징 선택은 머신러닝 모델의 성능에 큰 영향을 미칩니다. 우리는 주가 예측을 위해 여러 금융 지표와 기술적 지표를 특징으로 사용할 수 있습니다.

4.1 특징 생성

간단한 이동 평균(Simple Moving Average, SMA)과 상대 강도 지수(Relative Strength Index, RSI)와 같은 기술적 지표를 생성하여 모델이 학습할 수 있는 유용한 정보를 제공할 수 있습니다.

stock_data['SMA'] = stock_data['Close'].rolling(window=20).mean()
stock_data['RSI'] = compute_rsi(stock_data['Close'], window=14)

4.2 데이터셋 분할

데이터를 훈련 세트와 테스트 세트로 나눔으로써 모델의 일반화 성능을 평가할 수 있습니다. 일반적으로 80-20 비율을 사용합니다.

from sklearn.model_selection import train_test_split

train_data, test_data = train_test_split(stock_data, test_size=0.2, random_state=42)

5. 모델 학습

이제 모델을 구축하고 학습할 차례입니다. 파이토치를 사용하여 인공신경망을 구축하는 방법에 대해 설명하겠습니다.

5.1 모델 구성

파이토치에서는 nn.Module을 상속하여 신경망 모델을 정의할 수 있습니다. 아래는 간단한 피드포워드 신경망의 예입니다:

import torch
import torch.nn as nn

class SimpleNN(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(input_size, hidden_size)
        self.fc2 = nn.Linear(hidden_size, output_size)
        self.relu = nn.ReLU()

    def forward(self, x):
        x = self.fc1(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x

model = SimpleNN(input_size=3, hidden_size=10, output_size=1)

5.2 모델 훈련

모델을 훈련하기 위해 손실 함수와 최적화 알고리즘을 정의해야 합니다. 아래는 손실 함수로 MSE(Mean Squared Error)와 Adam 최적화 알고리즘을 사용하는 예입니다:

criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

for epoch in range(100):
    model.train()
    inputs = torch.from_numpy(train_data[['SMA', 'RSI']].values).float()
    labels = torch.from_numpy(train_data['Close'].values).float().view(-1, 1)

    optimizer.zero_grad()
    outputs = model(inputs)
    loss = criterion(outputs, labels)
    loss.backward()
    optimizer.step()

6. 모델 평가 및 예측

모델이 훈련된 후, 테스트 데이터셋을 활용하여 성능을 평가합니다. 주가 예측 모델의 정확도를 확인하기 위해 RMSE(Root Mean Squared Error)를 사용할 수 있습니다.

model.eval()
with torch.no_grad():
    test_inputs = torch.from_numpy(test_data[['SMA', 'RSI']].values).float()
    predictions = model(test_inputs).numpy()
    rmse = np.sqrt(np.mean((predictions - test_data['Close'].values) ** 2))
    print(f'RMSE: {rmse}')

7. 실제 트레이딩 시스템 구축

모델을 기반으로 한 실제 트레이딩 시스템 구축 과정에는 신호 생성, 주문 실행 및 포트폴리오 관리 등이 포함됩니다.

7.1 신호 생성

훈련된 모델을 이용하여 매매 신호를 생성하는 방법은 다음과 같습니다:

signal = np.where(predictions > test_data['Close'].values, 1, 0)

7.2 주문 실행

신호에 따라 실제 주문을 실행하려면 API가 필요합니다. 예를 들어, Alpaca Trading API를 사용할 수 있습니다.

import alpaca_trade_api as tradeapi

api = tradeapi.REST('APCAAPI-KEY-ID', 'APCAAPI-SECRET-KEY', base_url='https://paper-api.alpaca.markets')
for i in range(len(signal)):
    if signal[i] == 1:
        api.submit_order(
            symbol='AAPL',
            qty=1,
            side='buy',
            type='market',
            time_in_force='GTC'
        )

8. 결론

이번 강좌에서는 파이토치 1.4를 활용해 머신러닝 및 딥러닝 기반의 자동매매 시스템 구축 방법에 대해 살펴보았습니다. 데이터 수집에서 모델 훈련, 예측, 그리고 실전에서의 주문 실행과 포트폴리오 관리까지 다양한 단계를 다뤘습니다. 머신러닝 및 딥러닝 기술은 앞으로도 계속 발전해 나갈 것이며, 금융시장에서는 더욱더 중요한 역할을 할 것입니다.

향후 더 발전된 모델 구축을 위해 다양한 아키텍처와 알고리즘을 실험해보는 것을 추천합니다. AI 기반의 투자 전략은 시간이 지남에 따라 점차 강력해질 것이며, 이에 발맞추어 여러분의 자동매매 전략도 지속적으로 개선해 나가시기 바랍니다.

참고문헌

“Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow” – Aurélien Géron
PyTorch Documentation
Financial Machine Learning by Marcos Lopez de Prado