나는 3080ti로 연구를 하고 있는데, 메모리가 부족하고 실험을 몇 개 더 돌리고 싶어 3090나 V100 대여를 알아보고 있었다. 그런데 GPU 대여 업체 중에서 일 단위나 시간 단위로 대여를 해주고, 즉시 빌릴 수 있는 곳이 거의 없었다. 또는 가격이 시간 당 4000원 (T4)나 일 20000원 (3090) 으로 비쌌다. 그러다가 찾은 것이 vast.ai이다.
vast.ai의 장점은 저렴하고 즉시 대여가 가능하다는 것이다. 3090은 시간 당 0.7달러, 3080은 0.4달러 정도로 거래되는데 많은 국내 업체에 비해 저렴하다. 그리고 SSH 또는 주피터 노트북으로 접속 가능해 코드를 돌리기 편하고, PyTorch, tensorflow, cuDNN을 기본 옵션으로 설치할 수 있다. 딥러닝 용 GPU 대여에는 최고의 서비스인 것 같다.
사용 방법
로그인하고 콘솔에 들어간다. 먼저 create 탭에 들어간다. 그러면 현재 대여 가능한 GPU 리스트가 보인다.
이 중 파란색 Edit image & config 버튼을 눌러 원하는 옵션을 정해준다.
- Launch mode 주피터 노트북 / SSH
- Disk space 태스크에 따라 다르겠지만 나는 최소 60GB는 한다. 어차피 매우 저렴하다.
- On-start script tensorflow, PyTorch, CUDA/cuDNN, caffe 등 필요한 것을 미리 설치할 수 있다
이제 조건에 맞는 GPU 중 가격과 사양이 적당한 것을 빌리면 된다. 그리고 카드를 연결해 결제를 하고, 콘솔의 Instance 탭에 들어가 Start 버튼을 누르면 가격 산정이 시작되면서 서버가 열린다. Connect 버튼을 누르면 ssh 연결 커맨드를 알려주거나 주피터 노트북 페이지가 열린다. 이제 사용하면 된다! 아래 커맨드로 구매한 사양이 맞는지 확인해보자.
nvidia-smi // CUDA, cuDNN과 드라이버가 잘 깔렸는지 확인하고, 내가 구매한 GPU가 맞는지 확인하기 위해
df -h // Storage가 구매한만큼 있는지 확인하기 위해
사용 후기
너무 싸서 사기일 줄 알았는데 사기가 아니다. 그런데 주의할 점은 cudnn을 기본 옵션으로 설치하지 않으면, 이후에 anaconda 설치 시 nvidia driver mismatch 오류가 발생한다. 원인은 모르겠지만, 꼭 cudnn을 포함해 서버를 구매해야 한다. 쓰지 않을 때 멈춰놓으면 돈이 나가지 않는 것은 좋았지만, 너무 오래 멈춰 놓으면 다른 사람이 이 GPU를 구매해서 그 사람이 다 쓸 때까지 못 쓸 수도 있다. 그러면 다른 서버를 대여해 초기 설정 과정을 다시 거쳐야 한다. 저렴한만큼 어쩔 수 없다고 생각하고, 앞으론 최대한 로컬에서 작업을 완료한 후 멈추지 않고 돌리려 한다.
댓글