Guide to Information Graphics - 그래프 맞춤법

IMG(Guide to Information Graphics.jpg)
THE WALL STREET JOURNAL : Guide to Information Graphics
THE DOS AND DON'TS OF PRESENTING DATA, FACTS, AND FIGURES

주문한 책이 왔다. 사실 내가 정말 기대했던 책은 이 책이 아니라, Playfair's Commercial And Political Atlas라는 책이었기에 이 책만 발송됐다는 소식에 조금 맘이 아팠다. 그래도 다행히 다음주에는 받아볼 수 있을 거 같다, 아싸라뵤~ +_+

저 책에 관한 얘긴 내키면 좀 더 하기로 하고.

이 책을 받아본 순간 솔직히 조금 실망했다. 무엇보다도 겉표지가 상당히 더러웠다. 게다가 책값을 하지 못 하는! 빈약한 볼륨.

비싼 돈 주고 원서 사보는데 이래서야 기분이 상쾌하지 않다.

하지만 책이라는 건 정말 무섭다. 책의 아름다움은 거기에는 없고, 전혀 다른 곳에 있기 마련이니까 말이다. 도서관에서 빌려온 너덜너덜한 책이라고, 그 책의 가치가 떨어지는 건 결코 아니다. 아무리 아름답게 치장을 한다고 해서 아무런 내용도 없는 책이 가치있어지는 것도 아니다. 그리고 그렇기 때문에 이 책은 아름다운 책이다.

이 책은 월스트리트저널에서 그래픽 디렉터를 맡고 있는 Dona Wong의 책이다. 제목에서도 알 수 있지만 이 책은 그래프를 그리는 방법에 대해서 다루고 있다. 단순히 그래프를 그리는 방법에 관한 책은 아니다. 비유하자면 이 책은 그래프의 맞춤법을 다루고 있다. 나야 기본적으로 맞춤법을 좋아하는 사람은 아니다. 많은 사람들이 맞춤법으로 사람을 판단한다. 근데 나는 그런 게 사람을 평가하는 기준은 될 수 없다고 생각한다.

그럼에도 그래프에 있어서만큼은 그런 생각을 한 보 양보할 수밖에 없다. 그건 그래프라는 표현 수단이 지나칠 정도로 직관적으로 파악되기 때문에 그렇다. 여기에 그래프의 기묘한 모순성이 담겨있다. 그래프는 직관적이다. 그래서 사람들은 그래프를 만능 도구 정도라고 생각하고 누구나 쉽게 이해할 수 있을 거라고 믿는다. 분명 같은 내용에 대해서 이야기한다면 그래프는 글보다 훨씬 더 직관적이다. 하지만 그래프가 쉽다는 건 완전히 잘못된 생각이라고 생각한다. 그리고 이 책을 읽으면서 그런 생각은 더더욱 확고해졌다.

그러니까 직설적으로 말할 필요가 있다. 그래프는 어렵다. 세상에는 잘못된 그래프들이 넘쳐나고 있다. 이 책에는 맨 처음에 3개의 그래프를 보여주면서 이 그래프들이 좋은 차트의 기본적인 룰을 어기고 있다고 이야기한다. 그렇게 가볍게 도발을 섞어 독자들을 채근한다.

IMG(errorgraph.jpg)

뭐가 잘못 됐는지 눈에 보이는가?

이걸 알 정도면 그래프에 상당한 관심이 있는 사람일 거다. 혹은 관심을 가질 수밖에 없는 입장에 있어봤거나. 사실 잘못 됐다는 표현이 올바른 표현은 아니다. 그래프가 잘못된 게 아니다. 저자의 이야기처럼 좋은 차트의 기본적인 룰을 어기고 있는 것뿐이다. 하지만 이건 정말정말 중요하다.

그건 그래프가 가지는 근본적인 함의 때문에 그렇다. 솔직히 나는 인문학적인 글은 본질적으로 같은 이야기를 하면서도 절대 같은 해석에 다다를 수 없다고 생각한다. 인문학적인 글이 그렇다면 소설이라든지 수필 같은 건 말할 필요도 없다. 하지만 그래프는 다르다. 그래프는 그 해석이 독자의 자유에 있다고 할지언정, 그 그래프가 보여주고자 하는 데이터에 대해서는 항상 같은 인식을 목표로 해야하기 때문이다. 어떤 의도를 가지고 그래프를 만들어도 좋다. 그걸 하지 말라고 해서는 안 된다. 하지만 그래프는 데이터를 왜곡하기 위한 수단이 아니라는 걸 이해해야만 한다. 따라서 좋은 그래프라는 건 존재한다.

그래프는 사람들이 생각하는 것 이상으로 많은 데이터를 담고있다. 그런 그래프라는 수단은 전혀 강건하지 않다. 오히려 작은 실수나 조작에도 완전히 다르게 보일 수 있다. 좋은 그래프라는 건 바로 그러한 실수나 인위적인 조작을 하지 않은 그래프를 말한다. 그렇기 때문에 그러한 기준 위에서 좋은 그래프는 누가 그려도 어느 정도 선까지는 비슷할 수 있다. 비슷해야만 하는 거다.

위에 그래프들이 잘못된 점을 간단히 이야기해보면, 먼저 첫번째 그래프는 y축의 단위가 직관적이지 않다. 어떤 수치인지 제시되어있지는 않지만 3이라는 단위는 분명한 이유가 있지한 애매모호할 수밖에 없다. 현대문명에선 10진수를 사용한다. 저자는 2단위나 5단위의 단위를 사용할 것을 권장한다. 두번째 그래프는 y축의 시작 단위가 0이 아니다. 아는 사람은 아는 얘기지만, 이런 식의 그래프 왜곡은 그래프를 같은 수치를 완전히 다르게 보이는 효과를 낳는다. 3번째 그래프는 각각의 파이의 배열이 올바르지 않다. 저자는 파이가 큰 항목부터 원의 맨 위에서부터 시계방향으로 그릴 것을 권장하고 있다.

(저자는 아닌 것 같지만, 일부 사람들은 파이 그래프는 왜곡 효과가 크기 때문에 애시당초에 사용하지 말라고 권장하기도 한다. 언젠간 절대 사용하지 말아야 된다는 주장도 본 것 같다. 실제로 파이 그래프를 다른 그래프로 대체 불가능한 경우는 거의 없다고 해도 무방하다.)

이런 것들은 너무너무 사소한 문제들로 보인다. 그런데도 왜 이게 문제가 되는 걸까? 그건 앞서도 말했지만 그래프라는 표현 수단이 지나치게 직관적이기 때문이다. 두 가지 방향에서 접근해보자면, 먼저 그래프는 쉽다. 정말 단순한 그래프를 파악하는 건 정말 순식간이다. 이건 글을 읽는 것과는 비교할 수 있는 그런 게 아니다. 잘 알려져있다시피 사람의 인식은 패턴을 구분해내는 데 있어서 천재적이다. 천재적인 재능이 필요한 게 아니라, 그냥 누구나 다 천재적이다. 그러니까 거기에 잘못된 인식을 심어주면, 여전히 쉬우면서도, 왜곡은 쉽게 눈에 띄지 않는다. 저자가 제시한 잘못된 그래프들은 아무 생각없이 보면 절대로 이게 잘못되었다는 걸 발견할 수 없다.

반대편에 서보면 그래프는 너무나도 어렵다. 위에 제시된 예들은 단순화된 예들이지만 그래프 상에 너무 많은 요소들이 놓이게 되면 무엇이 중요한지 파악할 수 없게 돼버린다. 이것도 글과 비교해서 생각해보면, 별 이유없이 복잡한 그래프를 제대로 읽어내는 건 어려운 글을 읽는 것만큼이나 어려운 일이다.

쉽기 때문에 잘못 이해되고, 어렵기 때문에 이해될 수 없다.

그러니까 그래프는 제대로 그려져야만 한다. 쉽다는 이유에서도, 어렵다는 이유에서도 제대로 그려져야 한다. 위에서 제시한 정말 간단한 지침조차 지키지 않는 그래프들은 세상에 넘쳐난다. 이 책에는 훨씬 더 많은 좋은 예와 나쁜 예를 다루고 있다. 그런 지침들은 하나하나 어려운 것들이 아니다. 오히려 그래프에 대해서 약간의 관심만 있는 사람이라면 누구나 읽을 수 있가 만들어진 책이다. 그 이야기들은 조금만 궁리해보면 당연하고 당연해서 당연한 얘기들이다. 그게 당연하다는 것조차도 너무나도 직관적이다. 한글 맞춤법을 보다보면 올바른 맞춤법이라는 데서 일상적 직관에 반대되는 예들을 수도없이 볼 수 있다. 그런 걸 잘났다고 지적하는 사람들은 밥맛이다. 하지만 그래프 맞춤법은 일단 설명을 들으면 납득할 수밖에 없다. 앞서도 이야기했지만,

그래프는 그 해석이 독자의 자유에 있다고 할지언정, 그 그래프가 보여주고자 하는 데이터에 대해서는 항상 같은 인식을 목표로 해야하기 때문이다.

그렇지 않다고? 그런 걸 통계적 사기 행위라고 한다.

이 책은 150p라는 작은 볼륨에 산발적으로 얘기되고 얘기되고 얘기돼오던 좋은 그래프를 위한 지침들을 모아놨다. 단순히 나쁜 예와 좋은 예만을 다루고 있는 건 아니다. 그래프를 효율적으로 표현하기 위한 간단한 기법들과 통계치들에 대한 간단한 해설도 담고있다.

아, 재미있는 그래프가 있어서 하나 더 소개.

IMG(logmonth.jpg)

이 그래프는 만기에 따른 미국 국채 수익률을 나타낸 그래프다. x축이 정말 묘하다. 1개월 3개월 6개월에서 이내 1년으로 튀더니 비슷한 간격에 5년 10년이 그려진다. 내가 이걸 처음 본 건 아마 어느 투자론 책이었던 것 같다. 그 때는 이 기묘한 x축의 의미를 전혀 이해하지 못 했는데, 이 책의 설명에 따르면 개월수에 log를 씌운 지표라고 한다. 아하! 그런 비밀이. 조금 직관적이긴 않긴 한데, 알고보니까 달라보인다.

이런 책은 '드물다'. 이렇게 쉽고 설득력 있고 담백하고 아름다운 책은 오랜만에 본 것 같다. 프레젠테이션을 하는 사람이든, 어떤 이유로든 그래프를 그릴 필요가 있는 사람이라면 누구나 가지고 있어야한다. 적어도 한글 맞춤법을 지켜야겠다는 만큼의 의지는 보일 필요가 있다는 거다. 맞춤법 지적당해서 창피한 만큼은 창피한 줄 알아야한다.

뭐, 나는 맞춤법 틀려도 전혀 창피하지 않지만 ^^

정보시각화에 조금이라도 관심있다면 Edward, Tufte라는 이름을 들어봤을 텐데, 저자의 Tufte 교수 밑에서 공부했던 것 같다. 정보시각화에는 크게 두가지 흐름이 있다고 생각되는데, 하나는 단순히 데이터를 드러내기 위한 도구로서가 그렇고, 두번째는 그러한 데이터를 미적으로 인식적으로 어떻게 결합할 것인가 하는 흐름이 그렇다. 아, 단 이 두 흐름은 상호보완적이지 모순적이라는 이야기는 전혀 아니다. Tufte 교수는 특히나 두번째 영역에서 독보적인데 실제로 잘못된 그래프의 왜곡률을 공식으로 만들어가면서까지 제대로된 그래프를 강조했던 분이다. 그런 걸 생각하면 그 밑에서 이런 훌륭한 책이 나오는 것도 납득이 된다.

그리고 이런 훌륭한 분이 그래픽 디렉터로 있는 월스트리트 저널은 훌륭한 신문임에 틀림없다. 아마.

본 적 없지만.

그러고 보면 정보시각화 하면 뉴욕 타임즈도 유명한데, 아 이 분도 원래는 뉴욕 타임즈에 계시다가 옮겼구나. 잘못된 그래프의 향연인 한국신문들을 생각하면 묵념. 시간이 많이 많이 남으면 언젠가 신문 좀 까보자. 그렇다고 오해하진 말길. 미국이 제대로 됐다는 게 아니라, 그나마 제대로 된 게 있다는 게, 그런 노력을 정면에서 하는 사람이 있다는 게 부러운 거다. 그냥 그 뿐이다.


Who am I?