핸즈온 데이터 시각화 Hands-On Data Visualization 본문

Programming

핸즈온 데이터 시각화 Hands-On Data Visualization

halatha 2022. 7. 19. 11:08

  • 데이터 시각화라면 차트나 그래프를 통해 데이터를 더 보기 좋고 이해하기 쉽게 만드는 일이라고 단편적으로 생각했던 나에게 이 책은 예상보다 훨씬 더 넓은 시각화의 세계를 알려줬다. 많은 교육 기관에서 데이터 시각화 입문 교재로 이 책을 활용한다고 하는데, 책의 구성뿐만 아니라 내용이 교과서로 사용할 정도로 자세할 뿐만 아니라 정말 교과서에서나 볼법한 주제를 반복적으로 알려주고 있다는 점에서도 의외였고 좋았다.
  • 책의 구성은 총 4부로, 1부 기본 기술에서는 도구 및 데이터를 이용해 스토리를 구상하는 기초, 2부 시각화 구축에서는 난이도가 낮은 도구로 실습, 3부 코드 템플릿과 고급 도구에서는 코드를 직접 다뤄야 하는 정도의 난이도가 높은 도구로 더 다양한 시각화를 소개, 4부 진실하고 의미 있는 스토리 전달하기에서는 이 책에서 반복적으로 이야기하는 데이터를 이용해 진실하고 의미 있는 스토리 전달에 대해 설명한다.
  • 가디언이나 뉴욕 타임스의 사례가 아니더라도, 이제 한 번 만들면 변하지 않는 시각화가 아니라 사용자와의 인터랙션이 기본이 되면서 기술적인 요소는 전보다 훨씬 더 중요해졌고 앞으로도 3D뿐만 아니라 AR, VR 같은 분야를 생각하면 시각화에서도 기술의 중요성은 점점 더 높아져만 갈 것이 확실하다. 하지만 저자는 일관되게 진실한 이야기를 전달하는 스토리를 구성해야 한다고 말한다.
  • 초반에 처음 소개하는 지도도 부의 불평등에 대한 지도를 어떻게 전달하느냐에 따라 둘 다 진실을 전하지만 느낌이 달라지고 중요하게 생각하는 부분이 변한다는 걸로 시작한다. 테니스 스타 세레나 윌리엄스가 겪었던 흑인 여성에 대한 차별이나 유명한 메르카토르 도법의 문제점 등 데이터 자체의 문제, 알고리즘의 편향성, 시각화가 유도하는 의도한(혹은 의도치 않은) 인식의 문제 등을 알려주고, 데이터 시각화가 왜 중요하고, 또 어떤 면을 전달해야 하는지 설명한다. 또 다른 기술들도 마찬가지이지만, 시각화 기술 역시 계속 발전하므로, 단 하나의 정답만 고수하지 않고 진실을 보여주기 위한 방법을 지속적으로 찾아야 한다고 주장한다.
  • 좋은 기술을 알려주면 악용하는 일이 항상 발생한다. 책에서 차트를 사용해 속임수를 쓰는 방법도 설명하기 때문에 어쩌면 그렇게 저자의 의도와는 반대되는 결과를 가져올 수도 있다. 하지만, 시각화의 기술과 그 파급력, 또 그래서 어떤 마음을 가지고 기술을 대해야 할지까지 같이 작성한 걸 보면, 저자는 좋은 사람이기도 할 거란 생각이 든다. 다양하고 좋은 시각화 기술만 볼 거라고 생각한 나에게 저자는 시각화도 데이터를 다루는 일이므로 역시 항상 편향, 편견을 조심해야 한다는 점을 알려줬다. 생각보다 더 좋은 책을 읽게 되어 기분이 좋다.

한빛미디어 ‘나는 리뷰어다’ 활동을 위해서 책을 제공받아 작성된 서평입니다

정보란 마법처럼 갑자기 나타나지 않습니다. 대신 사람들은 그들이 속한 사회와 시간 안에서명시적인 목적 또는 암시적인 목적을 가지고 데이터를 수집하고 공개합니다. 데이터 시각화의목적이 그렇듯이 우리는 정보가 부족한 그 어떤 것보다는 근거에 기반한 추론을 선호합니다.그러나 숫자를 비롯한 여러 형태의 데이터는 객관적이지 않기에 우리는 소위 말하는 데이터 객관성 objectivity을 무작정 옹호할 수는 없습니다. 따라서 데이터를 다룰 때는 잠시 멈춰서 '누구의 이야기가 전해지고 있는지 그리고 '누구의 견해가 아직 전해지지 않았는지 깊게 고민해봐야 합니다.

테니스 스타 세리나 윌리엄스 Serena Williams 사례를 통해 데이터 수집 이슈가 '권력과 특권'이라는 더 큰 이슈와 직접적으로 연결되어 있음을 강조

데이터를 검색할 때는 공공 데이터와 개인 데이터 관련 논쟁에 대해 이해할 필요가 있습니다. 이런 논쟁은 데이터 시각화 프로젝트에 어떤 종류의 데이터를 합법적으로 사용할 수 있을지 결정할 뿐만 아니라 어떤 사람들이 어느 정도 수준에서 개인 관련 사적 정보를 수집하고 배포해도 되는지에 대한 윤리적 문제와도 연관됩니다.

'개인에 대한 데이터는 어느 정도까지 수집이 허용되어야 하는가?'

데이터에 대한 사회적 정의가 계속해서 바뀐다면 이를 시각화할 수 있는 완벽한 방법은 없습니다. 따라서 데이터에 대해 선택할 때 메모나 첨부한 텍스트에 본인의 사고 과정을 기술해야 합니다.

기본 차트 구성 요소

11장 Chart.js와 하이차트 템플릿

12장 리플릿 맵 템플릿

13장 지도 데이터 변환하기

14장 거짓을 발견하고 편향 줄이기

15장 데이터 스토리 말하고 보여주기

Comments