전체 글 18

처음 도전하는 데이터 시각화 | 데이터 분석의 꽃, 대시보드

업무 중 처음으로 대시보드 제작 업무를 맡았다.기존 대시보드로는 봐야될 내용이 너무 많아 오히려 하나도 눈에 들어오기 어려운 형태였다."전체적인 내용은 간소화하면서 명확히 보여줄 내용에 집중하기"말은 쉽지만 막상 뭘 어떻게 보여줘야 되나 생각해 보면 막막했다. 시작 전 몇 차례 단계를 정해놓고 그대로 실행에 옮겼다. 1. 열람 대상 선정(누가? 왜?)우선 이 대시보드를 누가, 왜 보는 지에 대해 생각해야 한다. 매일 실적 보고를 하면서도 누가, 왜 보는지, 보고 나서 어떤 액션을 취할지 한 번도 깊게 생각해 본 적 없었다. 막연히 늘 해오던 일이기 때문에 해 왔을 뿐 이 보고의 목적과 의미 따위(?)는 관심 밖이었다.그러나 대시보드를 새로 제작하게 되면서 가장 먼저 떠올리게 된 부분이 바로 '누구를 위해..

2024.07.15

데이터 전처리의 중요성 | 머신러닝 EDA? 엑셀부터 차근차근

데이터 분석가 초심자로서 요즘 가장 중요하다고 느끼는 부분이 있다. 바로 데이터 전처리이다. 데이터 전처리가 제대로 되지 않은 상태에서 데이터 집계를 하게 되면 처음엔 아무리 사소했을 지라도 결국엔 '스노우볼(snow ball)효과' 처럼 그 끝엔 꽤나 참담한? 결과를 얻을 수 있다. 내가 그랬다. ● 엑셀을 소홀히 하지 말자.. '절대'이론으로 처음 배운 '데이터 전처리'라고 한다면 EDA가 있는데 그 당시에는 머신러닝, 딥러닝 등 고차원 수준에서만 사용하는 행위로 여겼다.엑셀, 구글시트 등 보다 보편적인 데이터 업무 환경에서부터 전처리 과정을 생활화 해 두는 게 바람직하고, 결과적으로도 훨씬 더 나은 작업물을 낼 수 있다.나같이 데이터를 많이 다뤄보지 않고 국비 교육을 통해 데이터를 다루기 시작한 사..

2024.07.09

티스토리 블로그를 시작하는 이유 3가지

티스토리 블로그를 시작하게 되었다. 평소 자기계발 도서나 영상을 자주 접하는 편인데 글쓰기에 대해 부정적으로 말하는 글은 한 번도 못봤다. 나 역시 글쓰기만큼 내 생각을 정리하기 좋은 수단은 없다고 생각하면서도 꾸준히 실행한 적은 없었다(약 20권 가까이의 독서 후기 글을 써 본 경험 정도).  내가 관심있어 하는 분야를 세 가지로 추리고, 그에 해당하는 영단어 첫 글자를 따서 블로그 이름 및 카테고리를 정했다.A = Analytics(데이터 분석)B = Books(독서)C = Capital(재테크) 어떤 계기로 티스토리 블로그를 시작하게 되었는지 나부터 정리해 보고자 첫 글의 주제로 잡게 되었다. 다양한 이유가 섞여 있지만 이를 3가지 정도로 나누어 적어 보고자 한다. 1. 본업공부약 2년 전 처음 빅..

2024.07.07