기본 콘텐츠로 건너뛰기

추천 가젯

[혼공머신] 5주차_미션 "기본미션"

  기본 미션 Q. K-평균 알고리즘 작동 방식 설명하기 A. K-평균 알고리즘은 K개의 군집화를 하는 알고리즘 알고리즘이 작동하는 순은  1) 군집할 개수를 설정하면 K개의 중심을 랜덤으로 설정합니다. 2) 각 포인트들은 가까운 중심에 할당됩니다. 3) 할당된 데이터들의 평균값을 구하여 새로운 중심 값을 만들어냅니다. 4) 2번과 3번을 반복하여 중심 값의 변화가 없을때 까지 반복됩니다. 5) 중심의 값의 변화가 작은 상태 또는 거의 움직임이 없을 때 알고리즘은 완료가 됩니다.

내 손이 왜 이러지?!, 파이썬 시각화 굵고 짧게 익혀봅시다~!



 "import matplotlib... 그다음이 뭐였더라?"

"배우긴 배웠는데... 막상 사용하려니까 손이 안가네?"

"범례를 하려면... "


분명 파이썬 배웠고!! matplotlib도 배웠고!! seaborn도 배웠는데!!

막상 사용하려면 기억도 안나고 코드에 손이 안가는 분들에게 추천합니다.


최근 데이터 분석에 관련된 대시보드를 만들면서 처음 접해보는 대시보드에 한 번 놀라고 Python 만큼은 자신있었던 나의 손이 주저하는 모습을 보고 두 번 놀라는 경험을 하였다. 사실 내가 생각해도 모델링을 집중해왔지 시각화를 위해 집중해본적은 그리 많지 않았던 것 같다. 그래서 나는 Python 시각화에 관련된 서적을 찾기 시작했다.

<Matplotlib Tutorial - 파이썬으로 데이터 시각화하기> 이 책은 우리가 평소에 기본적인 코드만 보고 넘어갔던 내용을 차근 차근 설명하고 알려준다. 그래서 내용이 많지 않아 부담스럽지 않고 코드가 모두 짧아서 따라하는 것도 어렵지 않았다. 나의 경험을 바탕으로 주관적인 장점을 몇가지 소개하자면


첫 번째 소장할 가치가 있다. 사실 시각화 관련된 내용을 항상 기억하기에는 배워야 할 프로그래밍 언어도 많고 모델도 많다. 그래서 시각화를 막상 시작하려면 손이 멈칫, 두둠칫 하게 되는 모습을 볼 수 있다. 그렇지만 이미 배운 내용이기 때문에 살짝만 코드를 확인한다면 모두 기억나는 것이 Python을 활용한 시각화의 만인이 아는 룰이 아닐까 생각한다. 그래서 필요할 때 빠르게 훓어볼 수 있는 책으로써 굉장히 유용할 것으로 생각 된다.

두 번째 내용이 길지 않다. 사실 시각화 관련된 내용 중 길게 설명한 책을 많이 못본 것 같다. 이 책이 기본개념 서적이기 때문일 수도 있지만 정확한건 이 책을 정독한 사람이라면 훑어 보는데 부담스럽지 않을 것이라고 생각한다. 개념의 대한 설명이 간결하고 바로바로 확인 할 수 있는 코드를 보여줌으로써 독자가 책을 통해서 습득하는 사이클이 굉장히 빠르게 느껴진다.

세 번째  기본적인 내용에 비해 예제가 많다. 사실 시각화를 배우면서 다양한 예제를 갈구하는 것인 누구나 공감하지 않을까 생각한다. 실제로 우리가 시각화를 진행 하게 되면 다양한 조건과 환경으로 인해 시각화를 어떻게 해야 되고 어떤 그래프를 선택해야 되는지 고민하게 된다. 그래서 많은 예제를 접하는 것은 시각화를 준비해야되는 우리에게 백신이자 무기가 될 것이다. 


나는 이 책을 정독한 후 새로운 시각화 서적을 찾아보고 싶었다. 기본에 충실해야 된다는 말을 이 책을 통해서 많이 느꼈던 것 같다. 사람 마다 다르겠지만 기본적인 개념을 습득하고나서 다른 시각화 모듈을 접할 때는 왜 이렇게 되는데 어떤 값이 필요한지를 한 눈에 알 수 있었고 심화 과정 책이 없다는 것에 아쉬움이 조금 있었던 책이었다. 그러나 기본이 필요하다면 반드시 필요한 책이 아닐까 생각한다.

댓글

가장 많이 본 글