데이터는 기록이에요, 기록은 거짓말을 하지 않거든요. 사람의 기억은 망각하지만 데이터는 잊혀지거나 지워지지 않습니다. 저는 데이터가 물류의 미래를 이끌거라고 믿습니다.
CJ대한통운 TES물류기술연구소에서 데이터 분석을 담당하고 있는 송성렬 책임 연구원은 온종일 데이터 생각 뿐인 데이터 ‘덕후’다. 국내를 넘어 전세계에서 수집된 방대한 양의 물류 데이터를 다룰 수 있어 CJ대한통운에서의 데이터 분석이 매력적이라는 송성렬 연구원. 앞으로 더 다양한 분야에서 더 많은 양의 데이터를 다루는 것이 목표라는 송성렬 연구원의 데이터 ‘덕질’ 이야기를 들어보자.
방대한 양의 물류 데이터가 있는 곳, CJ대한통운
Q. 간단한 자기소개 부탁드린다.
CJ대한통운 TES물류기술연구소 AI•빅데이터팀 책임연구원으로 근무하고 있다. CJ대한통운에는 2017년에 입사해 근무 한지는 5년 정도 됐다.
Q. TES물류기술연구소는 2020년에 출범한 것으로 알고 있다. 연구소 출범 전에 입사했는데.
2020년에 기존의 물류연구소가 TES물류기술연구소로 확대 개편된 거다. 데이터와 기술을 연구하는 조직은 회사 내에 계속 있었다. 최근 물류 산업에도 기술 역량이 중요시되면서 TES물류기술연구소로 재편됐고 점점 조직 규모도 커졌다. 현재는 233명 정도되는 연구원들과 함께 근무 하고 있다.
Q. TES물류기술연구소에서 어떤 업무를 담당하고 있는지 궁금하다.
CJ대한통운 물류 프로세스에서 발생하는 데이터를 수집해 빅데이터를 구축하고, 이를 활용해 물류 운영을 효율화시키는 작업을 하고 있다. 예를 들어, 택배 터미널에는 컨베이어 벨트 위로 지나가며 택배 박스를 스캔하는 ITS라는 장비가 있는데, 이를 통해 수집된 택배 상품의 구체적인 정보와 그래픽 정보를 바탕으로 빅데이터를 구축했다. 이 데이터로 간선차(대형트럭)에 들어갈 수 있는 물량의 총 부피와 필요한 차량 수에 대한 예측이 가능해졌다. 또한 예상된 물량과 부피에 따라 택배 박스를 대분류하는 허브터미널, 배송지역에 있는 서브터미널의 운영 프로세스를 조정할 수 있어 효율성을 극대화할 수 있게 됐다.
데이터는 시행착오를 줄여주는 중요한 기록!
Q. TES물류기술연구소에는 석박사 출신 연구 인력이 많다고 들었다.
연구 인력 중에서는 석박사 출신이 많다. 내 경우에도 학부 때 컴퓨터공학을 전공했고, 석, 박사 과정에서는 AI 머신러닝 쪽을 연구했다. 대학교 4학년 때 우연히 AI 관련 강의를 들었는데, 데이터를 가지고 전혀 새로운 결과를 만들어 낸다는 게 흥미롭더라. 당시에는 커리어 생각보다는 연구 자체가 재밌어서 박사과정까지 하게 됐는데, 운 좋게 졸업을 하자마자 알파고로 인해 AI가 주목받기 시작했고, 덕분에 관련 업무로 첫 사회생활을 할 수 있었다.
Q. AI, 빅데이터는 다양한 분야에서 활용되고 있는데, 그 중에서 물류 회사를 선택한 이유가 있나.
CJ대한통운은 흔히 택배 회사로 생각하는 경우가 많다. 입사 준비 전에는 나도 그랬다. 하지만 CJ대한통운은 택배뿐 아니라 e-풀필먼트, 계약물류, 항만 등 다양한 물류 산업을 전개하고 있는 종합 물류 회사다. 또, 40개국 279개 거점에서 포워딩, 국제특송과 같은 글로벌 사업도 전개하고 있다. CJ대한통운에서라면 대한민국을 넘어 전 세계에서 오고 가는 물류 데이터를 다 만져볼 수 있겠다는 생각이 들어서 지원했다. 들어오니까 예상했던 것 이상으로 다양한 물류 데이터를 다룰 수 있는 환경이었다. 데이터를 만지는 사람으로서 이렇게 많은 데이터를 다뤄볼 수 있다는 것은 매력적인 부분이다.
특히, 시장 점유율 1위인 택배 산업 데이터를 분석하면 그야말로 대한민국의 모든 트렌드를 캐치할 수 있다. 이런 트렌드를 엮어서 ‘일상생활리포트’라는 보고서를 발간하기도 했다.
Q. 물류 산업과 동떨어진 분야를 연구하다가 CJ대한통운에 합류했을 때는 어려운 점은 없었는지궁금하다.
처음에는 물류 산업에 대한 이해가 없었기 때문에 공부를 많이 해야만 했다. 현장에 있는 설비들을 직접 보면서 데이터가 어떻게 생성이 되는지, 어떤 상황에서 어떤 값이 나오는지 파악하는 시간이 필요했다. 하지만 이 부분은 입사 후에 익혀도 되는 부분이다. 당장 우리 팀 구성원만 봐도 물류 전공자는 딱 한 명뿐이다. (웃음)
Q. CJ대한통운 TES물류기술연구소, 특히 AI•빅데이터 분야에 입사를 희망하는 취업 준비생에게 필요한 역량은 무엇이라고 생각하나.
우리 팀에서는 모든 데이터를 보고 있고, 봐야 하지만 그렇다고 해서 의사결정을 하는 데 있어서 모든 데이터가 중요한 건 아니다. 필요한 데이터가 어떤 것인지 파악하고, 이걸 어떻게 분석할지 판단하는 게 중요하다. 즉, ‘데이터를 보는 눈’이 데이터 분석 업무의 핵심 역량이다.
또, 물류 산업에 대한 이해도 중요하지만 그보다 중요한 건 데이터 분석 전반에 대한 경험이다. 학교에서의 데이터 분석 경험은 기업에서 받은 정리된 데이터를 활용하기 때문에 정제된 데이터를 가지고 진행되는 경우가 많다. 하지만 현업에서는 데이터를 정제하는 데이터 클렌징 작업이 필요할 수 있다. 데이터 수집부터 시작해서 클렌징, 분석, 모델링 등 데이터 분석의 A-Z를 경험해본 분이라면 더할 나위 없이 좋다.
TES물류기술연구소에서 석사 졸업예정자와 졸업자 분들을 대상으로 진행하는 채용연계형 하계 인턴십 프로그램이 있는데, 여기에 참여하는 게 실무를 경험하는 데 큰 도움이 되지 않을까 싶다. 작년에는 3명이 그전에는 2명이 이 프로그램을 통해 저희 팀에 입사했다. 신입 같은 경우에는 이런 프로그램을 잘 활용하는 것이 실무에 필요한 데이터 분석 역량을 쌓는 데 도움이 될 것이라 생각한다.
Q. 실무자로서 데이터가 중요한 이유는 무엇이라고 생각하는지 궁금합니다.
기본적으로 데이터는 기록인데, 기록은 거짓말을 하지 않는다. 사람의 기억은 망각하는 부분이 생기기 마련이지만, 기록된 데이터는 사라지거나 버려지는 것이 전혀 없다. 데이터를 보면 어떤 현상이 왜 일어났는지 원인과 결과를 분명하게 알아낼 수 있다. 직접 시행착오를 겪으면서 원인과 결과를 파악할 수도 있지만, 데이터 분석을 기반으로 의사결정을 하게 되면 시행착오의 횟수를 줄일 수 있다. 이런 점이 데이터 분석이 중요한 이유이자 매력이다.
CJ대한통운의 모든 데이터를 다룰 때까지 분석은 계속된다!
Q. 지금까지 CJ대한통운의 수 많은 데이터를 다뤘을 텐데, 가장 뿌듯했던 순간은 언제인가.
아무래도 사업화로 연결되는 순간이 가장 뿌듯하다. 최근에는 고객사를 대상으로 상품 주문량을 예측하는 ‘이커머스 주문량 예측 시스템’을 개발해 운영에 들어갔다. e-풀필먼트 서비스를 이용하는 고객사를 대상으로 다음날 상품이 얼마나 주문될지 주문량을 사전에 예측, 고객사에 제공해주는 시스템인데, 평균 예측 정확도는 88% 정도다.
사전에 상품 주문량을 정확히 예측할 수 있으면 고객사 입장에서는 재고 수급 계획을 더욱 정밀하게 수립할 수 있고, 이를 통해 비용의 절감이나 효율성 증가 효과를 기대할 수 있다. 소비자 입장에서도 기다리는 택배를 더 빨리 받을 수 있다. 이를테면 상품량을 예측해 적정한 수준의 재고가 확보되면 주문된 상품이 매진돼 늦게 받는 일이 적어지는 거다.
데이터 분석이 100% 사업화로 연결되는 건 아니다. 그래서 실제로 현장에 적용하고 사업부에서 인정을 받을 때가 가장 보람차다.
Q. 앞으로의 계획이 궁금하다.
처음에는 CJ대한통운을 택배 회사로만 오해(?) 했었는데, 지금도 마찬가지라는 생각이 든다. 아직도 모르는 사업 분야가 많다. 그래서 그만큼 여전히 경험해 볼 수 있는 분야가 많다고 생각한다. CJ대한통운 내에서 지금보다 더 많은 분야의 데이터를 다뤄보고 싶고, 나아가 물류 데이터를 종합해 새로운 서비스를 선보일 수 있도록 하는 게 목표다.