Tistory 2

데이터 전처리의 중요성 | 머신러닝 EDA? 엑셀부터 차근차근

데이터 분석가 초심자로서 요즘 가장 중요하다고 느끼는 부분이 있다. 바로 데이터 전처리이다. 데이터 전처리가 제대로 되지 않은 상태에서 데이터 집계를 하게 되면 처음엔 아무리 사소했을 지라도 결국엔 '스노우볼(snow ball)효과' 처럼 그 끝엔 꽤나 참담한? 결과를 얻을 수 있다. 내가 그랬다. ● 엑셀을 소홀히 하지 말자.. '절대'이론으로 처음 배운 '데이터 전처리'라고 한다면 EDA가 있는데 그 당시에는 머신러닝, 딥러닝 등 고차원 수준에서만 사용하는 행위로 여겼다.엑셀, 구글시트 등 보다 보편적인 데이터 업무 환경에서부터 전처리 과정을 생활화 해 두는 게 바람직하고, 결과적으로도 훨씬 더 나은 작업물을 낼 수 있다.나같이 데이터를 많이 다뤄보지 않고 국비 교육을 통해 데이터를 다루기 시작한 사..

2024.07.09

티스토리 블로그를 시작하는 이유 3가지

티스토리 블로그를 시작하게 되었다. 평소 자기계발 도서나 영상을 자주 접하는 편인데 글쓰기에 대해 부정적으로 말하는 글은 한 번도 못봤다. 나 역시 글쓰기만큼 내 생각을 정리하기 좋은 수단은 없다고 생각하면서도 꾸준히 실행한 적은 없었다(약 20권 가까이의 독서 후기 글을 써 본 경험 정도).  내가 관심있어 하는 분야를 세 가지로 추리고, 그에 해당하는 영단어 첫 글자를 따서 블로그 이름 및 카테고리를 정했다.A = Analytics(데이터 분석)B = Books(독서)C = Capital(재테크) 어떤 계기로 티스토리 블로그를 시작하게 되었는지 나부터 정리해 보고자 첫 글의 주제로 잡게 되었다. 다양한 이유가 섞여 있지만 이를 3가지 정도로 나누어 적어 보고자 한다. 1. 본업공부약 2년 전 처음 빅..

2024.07.07