In today’s world, there is a lot of statistical information around us all the time.
오늘날의 세상에는, 우리 주위에 항상 많은 통계적 정보가 있다.
Every time we read an article on the Internet or see a commercial on TV, we are likely to come into contact with numbers and figures.
우리가 인터넷으로 기사를 읽거나 TV에서 광고를 볼 때마다, 우리는 숫자들과 수치들을 접하기 쉽다.
Generally, these numbers help us make better decisions in our daily lives.
일반적으로, 이러한 숫자들은 우리가 일상생활에서 더 나은 결정을 내리도록 도와준다.
For example, when we choose which movie to see, we can check the ratings and see the reviews of thousands of viewers.
예를 들어, 우리가 어떤 영화를 볼지 고를 때, 우리는 (영화의) 평점을 확인하고 수천 명의 관객들의 후기를 살펴볼 수 있다.
Similarly, when people see statistics that show fastening a seat belt greatly increases the chances of surviving a car accident, they may choose to wear one themselves.
마찬가지로, 안전벨트를 착용하는 것이 자동차 사고에서의 생존 가능성을 크게 높여 준다는 것을 보여 주는 통계 자료를 보면, 사람들은 아마 스스로 안전벨트를 착용할 것이다.
These are just a few examples of how statistical information plays an important role in our lives.
이것들은 통계적 정보가 우리의 삶에서 중요한 역할을 하는 몇 가지 예시에 불과하다.
However, is it safe to believe statistics exactly the way they are presented to us?
하지만, 통계 자료가 우리에게 제시되는 방식 그대로 그것을 믿는 것이 안전할까?
Unfortunately, statistics can be misused in many ways.
안타깝게도, 통계 자료는 많은 방식으로 악용될 수 있다.
Let’s learn about some common tricks behind statistics.
통계 자료 뒤의 몇몇 일반적인 속임수에 대해서 알아보자.
Samples: How Many and Who?
표본: 얼마나 많이 그리고 누가?
On the Internet, Minjeong sees an advertisement that reads, “100% of users report brighter and softer skin with Blossom Company’s liquid facial soap.”
인터넷에서, 민정이는 ‘사용자들의 100%가 Blossom사의 액상 세안 비누로 더 환하고 부드러운 피부를 갖게 되었다고 말합니다’라고 쓰인 광고를 보게 된다.
It claims that these results are from an independent laboratory and are guaranteed by a public agency.
그것은 이러한 결과가 독자적인 연구소로부터 나왔으며 공공 기관에 의해 보장받는다고 주장한다.
Minjeong does not question the statistics and buys some bottles, despite the high price.
민정이는 이 통계에 대해 의문을 갖지 않고 비싼 가격에도 불구하고 몇 개를 구입한다.
However, although Minjeong uses the soap for a few months, she does not experience any noticeable changes.
그러나 민정이가 그 비누를 몇 달 동안 사용하지만 그녀는 어떤 눈에 띄는 변화도 경험하지 못한다.
Did Minjeong just happen to buy a defective product?
민정이가 그저 우연히 결함이 있는 제품을 샀던 것일까?
Or was the advertisement completely fake?
아니면 그 광고가 완전히 거짓이었을까?
When Minjeong read “100% of users,” she should have asked herself, “Where did the company get this figure?”
민정이가 ‘사용자들의 100%’를 읽었을 때, 그녀는 스스로에게 “회사가 이 수치를 어디에서 얻었을까?”라고 물었어야만 했다.
If Minjeong had read the tiny letters at the bottom of the ad, she would have found that the sample included only five people.
만약 민정이가 광고 하단의 작은 글자를 읽었더라면, 그녀는 그 표본이 단지 다섯 명만을 포함했음을 알았을 것이다.
As in this case, when a sample is not large enough to show a wide range of results, it can be misleading.
이 경우에서처럼, 표본이 다양한 결과를 보여 줄 만큼 충분히 크지 않다면, 그것은 오해를 불러일으킬 수 있다.
By using small samples, companies can come up with any results they want and use them for their own purposes.
적은 표본만을 사용함으로써, 회사들은 그들이 원하는 어떤 결과든지 내놓을 수 있고 그들의 목적을 위해 그 결과를 이용할 수 있다.
People can also get the wrong idea from statistics when a sample is not random.
사람들은 또한 표본이 무작위가 아닐 때 통계로부터 잘못된 이해를 할 수 있다.
For example, a restaurant may put survey cards on the tables, hoping to know what most customers think about its food, service, or atmosphere.
예를 들어, 한 식당이 자신들의 음식, 서비스, 분위기에 대해 대부분의 고객들이 어떻게 생각하는지를 알고자 식탁 위에 설문조사 카드를 올려놓을 수 있다.
However, few cards will be filled out by normal customers, because they don’t have any reason to do so.
그러나 일반적인 고객들로부터 작성되는 카드는 거의 없을 것인데, 왜냐하면 그들은 그렇게 할 이유가 전혀 없기 때문이다.
Only those with strongly positive or negative reactions are likely to respond to the survey.
오직 강하게 긍정적이거나 부정적인 의견을 가진 고객들만이 그 조사에 응할 가능성이 크다.
This method of choosing a sample is called “voluntary response sampling.”
표본을 고르는 이러한 방식은 ‘자발적 응답 표본 추출’이라 불린다.
Such samples are biased in favor of strong opinions and underrepresent the moderate ones.
이러한 표본들은 강한 의견에 유리하게 편향되고 중간의 의견들을 실제보다 적게 표시한다.
Therefore, when you see a statistic, remember that the sample is just as important as the statistic itself.
따라서, 당신이 통계 자료를 볼 때, 표본이 그 통계 자료만큼이나 중요하다는 것을 기억하라.
How many people were in the sample?
얼마나 많은 사람들이 표본에 있었는가?
Who were they?
그들은 누구였는가?
If you don’t know, be careful not to leap to conclusions.
만약 당신이 모른다면, 성급히 결론을 내리지 않도록 주의하라.
The Trap of Averages
평균의 함정
ABC Corporation wants to hire some employees.
ABC 기업은 몇몇 직원들을 고용하기를 원한다.
In order to look like a well-paying company and to recruit competent candidates, the company decides to distribute a press release that says the average yearly salary of its employees is $57,000, which is quite high.
보수가 좋은 회사로 보이고 유능한 지원자들을 모집하기 위해, 그 회사는 자사 직원들의 평균 연봉이 $57,000임을 나타내는 보도 자료를 배포하기로 결정하는데, 이는 꽤 높은 금액이다.
However, the fact is that more than half of its employees earn no more than $30,000 or less a year, and the most common salary for employees is only $20,000.
그러나 실제로는 회사 직원들의 절반 이상이 일 년에 겨우 $30,000나 그 미만을 받으며, 직원들에게 가장 흔한 연봉은 고작 $20,000에 불과하다.
Did the company spread false information?
회사가 거짓 정보를 퍼뜨린 것인가?
How is this possible?
어떻게 이것이 가능한가?
It’s because the company used the trap of averages.
그것은 회사가 평균의 함정을 사용했기 때문이다.
Averages can show different pictures depending on which type is chosen.
어떤 유형이 선택되는지에 따라 평균은 다른 상황을 보여 줄 수 있다.
To understand the meaning of different types of averages, let’s look at the illustration on the next page.
평균의 서로 다른 유형들의 의미를 이해하기 위해, 다음 페이지에 있는 삽화를 살펴보자.
Most often, the term “average” indicates the “mean.”
일반적으로 ‘평균’이라는 용어는 ‘산술 평균’을 가리킨다.
It is calculated by adding all the values in a group and dividing the result by the number of group members.
그것은 한 집단에 속한 모든 값을 더하고 그 결과를 그 집단 구성원의 수로 나눔으로써 계산된다.
However, the mean is not the only kind of average.
그러나 산술 평균이 평균의 유일한 종류는 아니다.
There are two more kinds: the “median” and the “mode.”
두 종류가 더 있다. ‘중앙값’과 ‘최빈값’이다.
The median is the number that is exactly in the middle of all the other figures.
중앙값은 모든 다른 수치들의 정확히 중간에 있는 숫자이다.
In this case it is $30,000, because 12 employees are making more than $30,000 and 12 are making less.
이 경우에 그것은 $30,000인데, 왜냐하면 12명의 직원들이 $30,000보다 많이 벌고 12명의 직원들이 그보다 적게 벌기 때문이다.
The mode is the number that appears most frequently—$20,000 in this case.
최빈값은 가장 빈번하게 나타나는 숫자이며, 이 경우
에는 $20,000이다.
As you can see in the illustration, there’re only a handful of people that are earning an average salary of $57,000 or higher.
당신이 삽화에서 볼 수 있는 것처럼, 평균 연봉인 $57,000나 그 이상을 버는 사람들은 오직 소수에 불과하다.
However, because the company wanted to be perceived as a well-paying one, it used the mean, which results in a deceptively high average salary.
그러나 그 회사는 보수가 좋은 곳으로 인식되고 싶었기 때문에 산술 평균을 사용했고, 이는 결국 기만적으로 높은 평균 연봉이 된다.
An average is convincing because it is so simple.
평균은 매우 간단하기 때문에 설득력이 있다.
To avoid being tricked, however, you have to know what sort of average is being reported.
그러나 속임수에 당하지 않기 위해서 당신은 어떤 종류의 평균이 이야기되고 있는지를 알아야 한다.
You also need to find out the distribution of the values in order to get a more accurate idea of the real data.
당신은 또한 실제 자료에 대한 더 정확한 이해를 얻기 위해서 값의 분포를 알아낼 필요가 있다.
Same Data, Different Graphs
같은 자료, 다른 도표
In mass media, graphs are often used because they display data more efficiently than tables of raw data do.
대중 매체에서, 도표들은 원 자료의 표보다 자료를 더 효율적으로 보여 주기 때문에 자주 사용된다.
However, graphs can be misleading, too.
그러나 도표 역시 오해를 불러일으킬 수 있다.
Let’s look at the two graphs below.
아래의 두 도표를 살펴보자.
The two graphs shown here illustrate how data can be misrepresented.
여기 제시된 두 도표는 자료가 어떻게 잘못 표현될 수 있는지를 보여준다.
In the first graph, the vertical axis goes all the way up to 100 and all the way down to 0, which makes the decrease in the percentage look modest.
첫 번째 도표에서, 세로축은 위로는 100까지, 아래로는 0까지 이어지는데, 이는 백분율의 감소를 완만하게 보이도록 만든다.
In the other graph, only 10 percentage points are shown, from 65 to 75, which makes the change seem much more extreme.
다른 도표에서는 65부터 75까지 단지 10퍼센트 포인트만 제시되는데, 이는 그 변화를 훨씬 더 급격하게 보이도록 만든다.
Notable is the fact that the two graphs are based on exactly the same data.
두 도표가 정확히 같은 자료를 기초로 하고 있다는 사실이 주목할 만하다.
So, if you want to point out the seriousness of skipping breakfast, you can use the second graph.
따라서, 만약 당신이 아침 식사를 거르는 것의 심각성을 지적하고 싶다면, 당신은 두 번째 도표를 사용할 수 있다.
In fact, you can make nearly any graph more convincing in favor of your argument by cutting off the graph at a certain point.
사실, 당신은 특정한 지점에서 도표를 잘라내서 거의 어떤 도표든지 당신의 주장에 유리하도록 더 설득력 있게 만들 수 있다.
Hence, whenever you see a graph, you should check the units on the vertical and horizontal axes to see what the highest and lowest values are.
그러므로 당신은 도표를 볼 때마다 가장 높은 값과 가장 낮은 값이 무엇인지 알아보기 위해 세로축과 가로축의 단위를 확인해야 한다.
Don’t simply assume the visual impact is the same as the real story.
시각적인 효과가 실제 내용과 같다고 단순히 추측하지 마라.
Check whether the graph is presented in a specific way to emphasize a point.
도표가 어떤 주장을 강조하기 위해 특정한 방식으로 제시되고 있는지 확인하라.
Look with a Critical Eye
비판적인 시각으로 보라
When people state opinions in articles, speeches, debates, or advertisements, they often give some statistics to support or reinforce their point.
사람들이 기사, 연설, 토론 또는 광고에서 의견을 말할 때, 그들은 종종 자신의 의견을 뒷받침하거나 강화하기 위해 몇몇 통계 자료를 제시한다.
If these statistics are found through proper research methods, then they are objective facts.
만약 이러한 통계 자료들이 적절한 연구 방법을 통해 얻어지면, 이는 객관적인 사실이 된다.
However, many statistics that you see and hear could just be numbers that are meant to convince you of a certain view.
하지만, 당신이 보고 듣는 많은 통계 자료들은 당신에게 특정한 견해를 납득시키기 위한 의도를 가진 숫자에 불과할 수도 있다.
Therefore, the next time you come across some statistics, don’t blindly accept any data that is presented.
따라서, 다음번에 어떤 통계 자료를 보게 되면, 제시되는 어떤 자료라도 맹목적으로 받아들이지 마라.
Look at the statistics in detail with a critical eye, and then judge whether or not they are convincing.
비판적인 시각으로 통계 자료를 자세히 살펴보고, 그런 다음 그것이 설득력이 있는지 아닌지를 판단하라.