-
Notifications
You must be signed in to change notification settings - Fork 1
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Performance Issue #6
Comments
learning_rate를 원 논문의
|
논문의 지표가 굉장히 이상함. 위는 AUC 80%지만 anomaly score 예측을 제대로 하지 못한 것을 확인할 수 있음. 이 쪽 분야는 다 이렇게 논문쓰나?
아래쪽(normal)이라고 찍어 맞춰서 AUC가 높나? 라고 하기엔 11 epoch은 또 AUC가 많이 낮음. 이건 ROC, AUC에 대한 추가적인 이해력이 필요할 것으로 보임 |
RTFM 저자가 제공한 feature(MGFN 저자 또한 동일한 feature를 사용했다)로 학습한 결과, 재현한 결과보다 loss 또한 안정적이며 AUC/PR 또한 꾸준히 오르는 것을 확인했다.
코드에 문제가 있었을지, 혹은 feature를 잘못 뽑았는지, TenCrop 적용이 잘못됐는지에 대한 사실관계 파악이 필요할 것으로 보임. |
아래는 저자가 제공한 pretrained model을 사용했을 때의 결과
논문에서 언급된 86.98%와는 차이가 있어보임. https://github.com/carolchenyx/MGFN./issues/27 해당 이슈에서도 언급된 부분. |
|
feature 상의 문제가 맞음. 위에서 authors의 feature로 진행했음에도 불구하고 위처럼 figure가 뜬 이유는 zero_grad를 생략했기 때문임.
이 당연한 한줄을 빼먹고 training을 진행하니 당연히 에러가 날 수 밖에 없음. Author's feature
My feature
|
pytorchvideo feature extractor 문제로 issue 종결. 차후 Tushar-N이 제공하는 (이것도 metaAI의 모델이긴 하다) resnet i3d 모델로 feature를 추출하고 performance 추이를 확인할 때 re-open |
colab pro+ 8월 결제 후 Tushar-N I3D로 뽑은 feature로 학습 재개.
이전의 model collapse현상 없이 안정적으로 학습하는 것을 확인할 수 있음. 85% 이상 재현에 성공하면 배포하고 Gradio로 hf space에 올리면 개인 사이드 프로젝트 완료될듯? |
feature extraction 코드 변경없이 pytorchvideo 모델말고 Tushar-N의 baseline I3D 모델로만 바꿨을 뿐인데 모델 수렴 정도가 확연히 달라짐. 이에 대한 고민은 학습 과정을 확인해야 확실히 알 수 있을 듯 |
아래는 1 epoch 결과. 5~7 epoch을 돌리면 AUC는 0.5에서 갇히는 현상이 지속적으로 발생함.
어디서부터 건드려야 할 지 알 수가 없음. 차후 시간이 허락하는대로
The text was updated successfully, but these errors were encountered: