탐험은 학습을 위해 너무 신경망의 예측에만 의존 하지 않도록 하는걸로 이해하는데 학습 완료 후 실제 매매 적용시에는 탐험은 0로 하는건가요???
탐험은 학습을 위해 너무 신경망의 예측에만 의존 하지 않도록 하는걸로 이해하는데
학습 완료 후 실제 매매 적용시에는 탐험은 0로 하는건가요???