우정본부 빅데이터 해커톤 후기

페이스북에서 이 해커톤을 광고하는 것을 보고 지원했다.

사전 미팅을 참석하라는 주최측 연락에 해커톤 전에 개포동 디지털단지에 가게 되었다.

주제는 특정 일자에 택배 물량 예측이었다.

빅데이터 해커톤이라는 이름에 비해 제공하는 데이터는 1년치 데이터이었다.

(끝날 때 주최측에서도 적은 데이터를 준 것 같다고 다음 번에는 많은 데이터를 준다고 한다 ㅎㅎ)

데이터는 배송날짜 / 받는 곳 / 수량 이런 식으로 이루어진 데이터이었다.

데이터를 분석해서 Feature을 추가해야하는 방향으로 나아가기로 생각했다.

간략하게 요약하면, 데이터를 분석한 결과 휴일 이후에 택배 수량이 급증하는 것을 확인할 수 있었다.

그것을 보고 요일이라는 Feature와 공휴일 다음날 Feature 등등 여러 Feature을 추가하게 되었다.

개발 도구는 Machine Learning 프레임워크인 Scikit Learn을 사용하여 진행했었다.

좋은 결과를 보여준 것은 Random Forest이었다.

리더보드에서 처음 1등에서 계속 밀려나게 되었다…

조금 더 다양한 Feature을 추가하지 못 해서 좋은 성능을 보여주지 못한 것 같다.

다른 팀에 인원 수도 부족하고 컴퓨터 성능의 중요성을 느끼게 되었다…

물론 다른 해커톤을 보면 개인이 출전해서 개인이 우승하는 것도 봐서 핑계일뿐..

대회에서 평가하는 점이 모델의 성능뿐만이 아니라는 것이다.

어떻게 아이디어를 활용할지가 더 중요한 평가 요소이다.

점수가 낮더라도 좋은 아이디어를 활용한다면 좋은 결과를 얻을 수 있다.

기억나는 것은 SNS 등을 활용한 아이디어도 있었다.

대회에서 아쉬웠던 점은 끝나가는 시점에 너무 대기하는 시간이 길었다는 점이다.

대기하는 시간에 차라리 성능을 올릴 수 있는 시간을 주던가

PPT을 보완할 수 있는 시간이었으면 좋았거라고 생각했다.

17시 ~ 18시에 끝났는데 거의 2시간 정도는 대기시간이었던 것 같다.

Categories:

Updated:

Leave a comment