차밍이
[DACON] AI프렌즈 시즌1 온도 추정 경진대회 - 02 : 대회 종료 및 소감 본문
Intro
Dacon의 AIFrenz 시즌1 온도 추정 경진대회에 참여한 차밍입니다.
2020년 03월 01일 ~ 2020년 04월 13일의 기간 동안 진행된 대회가 종료되었습니다.
총 972팀이 참여하였으며, 총상금 250만원!
마지막까지 치열하게 코드를 제출해서 점수를 갱신하는 모습을 볼 수 있었는데요.
다들 정말 대단한 것 같습니다. 특히나 혼자서도 우수한 결과를 보이신 '최상혁'님과 '먕'님 대단합니다.
소감 및 정리
대회의 팀명으로는 Python
이라는 팀명을 사용해서 진행했습니다.
어제 13일 날로 대회 제출이 마감되었고 최종 결과가 발표되었습니다.
가채점 결과 1.49684 점수로 5등까지 달성했습니다. 하지만 아쉽게도 최종 순위에서는 4.33점으로 9등으로 떨어졌습니다.
막 대회가 종료되었을 때는 앞에 많은 분들이 올라와서 12등까지 밀렸었는데, 몇 팀이 사라지고 9등으로 바뀌었습니다. 어떤 경우인지 아리송하네요. 여하튼 10등권 안에 들었다니 뿌듯합니다.
최종 결과와 수상자분들의 소스코드가 너무 기대됩니다. 저희 팀은 머신러닝의 앙상블 기법을 활용한 DT기반 LightGBM 모델을 사용해서 프로젝트를 진행해나갔습니다. 처음에는 딥러닝 쪽이 더 적합하다고 생각해서 전이 학습이나 MLP를 사용했었습니다. 하지만, 도저히 좋은 결과가 나오지 않아서 쉽게 사용할 수 있는 LightGBM으로 노선을 바꿨습니다.
하지만 지금 다시 생각해도 딥러닝 쪽이 맞는 것 같단 말이죠. 매우 부족한 label값으로 훈련시키기 매우 부족하고, train 데이터 자체도 매우 부족했었습니다. 대회 주최하는 쪽에서도 전이 학습을 의도하여 대회 문제를 출제하신 것 같습니다. 전이 학습이 정말 맞아 보이는데... 흠.... 그래서 더더욱 정말 궁금합니다.
마무리
데이터 싸이언스를 공부한 지 3개월 정도 된 시점이었습니다. 데이터 분석에 대한 실전 경험을 쌓아보고자 Dacon의 경진대회를 본격적으로 맘먹고 진행했습니다. 역시, 참여하기를 잘한 것 같아요. 프로젝트를 진행하면서 많은 것들을 배웠습니다. 데이터 분석을 위한 이론적인 내용들이 아닌, 실제 분석하고 결과를 이끌기 위해서 EDA를 진짜 많이 진행했었습니다. 센서든 간의 관계를 찾기 위해서 많은 노력을 했었는데, 헛발질한 것은 아닌가?라는 생각도 많았습니다. 해당 모델로 진행하는 게 맞나 라는 고민도 많이 했고요. 우여곡절이 많았지만, 그래도 팀원 분들과 어떻게 긍정적인 결과를 얻을 수 있어서 좋았습니다.
데이콘의 플랫폼이 참 훌륭하다고 생각합니다. 외국의 Kaggle과 같은 데이터 싸이언스 & Competition 플렛폼이 한국에도 생겨서 너무 좋네요. 특히나, 우승자 분들의 소스코드를 보고 공부할 수 있어서 좋았습니다. 이전에 열렸던 대회들의 내용과 소스코드를 보면서 많이 공부하고 현재 참여하는 대회에 맞게 적용해나가면서 정말 많은 것을 학습했습니다.
코로나로 인한 취업 시즌이 시작되면서 당분간은 바빠지겠지만, 이후에 또 도전해서 그때는 꼭 수상권으로 들어가고 싶습니다!!
소스코드 및 EDA 내용 정리
대회 제출용 소스코드와 ppt를 제작하는 과정에서 어떻게 모델과 결과를 만들어 나갔는지 정리해서 하나씩 포스팅해보도록 하겠습니다. 다들 수고 많으셨습니다.
'파이썬 > 머신러닝' 카테고리의 다른 글
[파이썬] 교차검증 Cross Validation 검증 (0) | 2020.03.26 |
---|---|
[DACON] AI프렌즈 시즌1 온도 추정 경진대회 - 01 : 대회 소개 및 참여 (0) | 2020.03.24 |
[파이썬] 실습 데이터를 사용한 SVM 모델 생성 및 예측, C와 감마(Gamma) (3) | 2020.03.18 |
[파이썬 머신러닝] Kaggle 타이타닉 데이터 생존자 예측모델 RandomForest와 DecisionTree (1) | 2020.03.16 |
[파이썬/데이터분석] LendingClub 원금 상환 여부 예측하기(2) 시각화 소스코드 (0) | 2020.03.12 |
[파이썬/데이터분석] LendingClub 원금 상환 여부 예측하기(1) : EDA와 데이터 시각화 (0) | 2020.03.12 |
[머신러닝] PCA 실습 (2) : 주성분분석이 성능을 높여주는가? (2) | 2020.03.04 |
[머신러닝] 실습으로 보는 PCA(주성분 분석)가 필요한 이유 (3) | 2020.03.02 |