회사에서 수집하는 데이터들이 많아짐에 따라 데이터와 관련된 것들을 볼 필요성을 느꼈다.
그래서 알아보게 된 개념이 데이터 리터러시, 많이는 들어봤는데 무엇인지는 잘 모르기에 개념을 잡아보고자 책을 읽어봤다.
데이터 리터러시에 관련된 다른 책도 읽어볼 예정이지만, 일단 이 책이 회사에 있어서 가볍게 읽고 리뷰해본다.
구성은
- 데이터 리터러시가 무엇인지
- 엑셀과 SQL 사용법 관련내용
- 회귀 분석등에 대해 많이 사용하고 있는 분석에 대한 내용
- 데이터로 일하기 위해서 참고할 내용
이런 구성으로 되어 있다.
엑셀과 SQL 사용법에 대해서는 이미 알고 있는 부분도 있고해서 넘기고 봤다. 그러다보니 꽤 많은 내용을 넘겼음에도 불구하고, 회사에서 시간이 날 때 짬짬히 읽다보니 꽤 시간이 걸렸다.
책에서는 통계나 머신러닝과 관련된 공부를 했으면 들어봤을 법한 회귀모델, 의사결정트리, 상관관계 등의 용어들이 나오긴 하는데 이를 잘 설명해줘서 모른 상태에서 읽어도 큰 부담이 없을 것 같다.
- 데이터 리터러시란 데이터 문해력이라는 이름으로 최근 많이 사용하고 있는 단어입니다. 데이터를 전문적으로 다루는 사람이 아니더라도 데이터를 통해 업무를 향상시키는 이해도를 총칭한 말로 쓰입니다. 보다 정확하게는 데이터를 읽고 이해하며 정보로 변환하여 커뮤니케이션할 수 있는 능력을 말하는 개념으로 사용됩니다.
- 데이터를 정보로 바꾸고, 정보를 지식으로 바꾸는 단계에서 데이터 밖 세상에 영향을 주는 것은 사람의 몫 입니다.
- 보유 데이터로 할 수 있는 것과 할 수 없는 것을 알아야 합니다.
- 데이터 분석의 시작은 큰 문제를 만드는 가장 핵심적인 작은 문제를 찾아 해결 문제로 전환하는 데 있다.
- 반복되는 가설은 사람들이 쉽게 의심하지 않습니다. 그 과정이 있는지조차 모르고 생략하기도 합니다. 이것은 처음부터 고객 정의 자체를 제한하는 것처럼 사용할 수 있는 자원의 눈을 좁히는 식으로 만듭니다. 지금 얻어야 하는 것의 목적에 맞게 가설이 세팅되어 있는지 확인해보고, 기존 방법을 계속해서 의심해 봅시다.
- 특히 인과관계와 상관관계에 대한 오용은 간편하게 어려운 길로 빠지게 만듭니다.
- 상관성은 결과만을 가지고 해석하게 만들어 줍니다. 결과로 나온 무엇과 무엇이 서로 양의 상관관계에 있으며 특히 1에 가까운 높은 상관계수를 가지고 있을 때는 무엇이 늘어날 때 무엇도 늘어나는 정도가 높다고 해석할 수 있습니다. 하지만 그것이 무엇이 변했기에 무엇이 변했다는 인과적 관계가 꼭 있는 것은 아닙니다.
- 아무리 좋은 분석 방법을 써도 조직 내부의 사람들에게 과정을 제대로 설명할 수 없다면 데이터로 일하는 문화는 쉽지 않습니다.
- 기존 데이터로 미래를 예측하는 인사이트, 기존 데이터와 외부 데이터를 결합한 인사이트, 기존 데이터를 요약하는 인사이트, 외부 데이터를 통한 시장 인사이트 이 4가지 사분면에서 어떤 일을 할 수 있을지 기획해보자.
책을 읽었지만, 아직 데이터 리터러시가 무엇이다. 하고 명확하게 설명할 수 있을 것 같은 느낌이 들진 않는다.
뭔가 안개 너머에 있는 무언가 라는 느낌이다.
그러나 데이터를 어떻게 활용해야하며, 그러기 위해선 어떤 방법들이 있고 나중에는 어떤 식으로 가야한다 하는 데이터 업무의 가이드를 제시해준 느낌이다.
'책 리뷰' 카테고리의 다른 글
사에즈리 도서관의 와루츠씨 (1) | 2024.09.05 |
---|---|
훅: 일상을 사로잡는 제품의 비밀 (8) | 2024.09.03 |
퀸의 대각선 (0) | 2024.07.28 |
침팬지 폴리틱스 (0) | 2024.07.28 |
가짜 노동 (0) | 2024.07.21 |