Библиотека knigago >> Наука, Образование: прочее >> Научная литература >> Искусство статистики Как находить ответы в данных


Книга представляет собой сборник статей шведско-норвежского историка Пера Рудлинга, посвященных исследованию Украинской повстанческой армии (УПА) и Организации украинских националистов (ОУН). Рудлинг анализирует историографию и современную интерпретацию этих организаций, раскрывая механизмы создания и распространения мифов о них. * Мифологизация УПА и ОУН как символов украинской национальной идентичности * Политическая эксплуатация исторической памяти о Второй мировой войне в Украине *...

СЛУЧАЙНАЯ КНИГА

Автор неизвестен - Искусство статистики Как находить ответы в данных

Искусство статистики Как находить ответы в данных
Книга - Искусство статистики Как находить ответы в данных.   Автор неизвестен  - прочитать полностью в библиотеке КнигаГо
Название:
Искусство статистики Как находить ответы в данных
Автор неизвестен

Жанр:

Научная литература

Изадано в серии:

неизвестно

Издательство:

неизвестно

Год издания:

-

ISBN:

неизвестно

Отзывы:

Комментировать

Рейтинг:

Поделись книгой с друзьями!

Помощь сайту: донат на оплату сервера

Краткое содержание книги "Искусство статистики Как находить ответы в данных"

Аннотация к этой книге отсутствует.


Читаем онлайн "Искусство статистики Как находить ответы в данных". Главная страница.

Статистикам
добросовестным

всего

мира –

людям,

педантичным,

стремящимся

отзывчивым,

использовать

данные

наилучшим образом
Введение
Цифры сами по себе не умеют говорить. Именно мы говорим за
них. Мы наполняем их смыслом.
Нейт Сильвер, «Сигнал и шум»

[1], [2]

Зачем нужна статистика?
Психологический портрет Гарольда Шипмана, более известного
как Доктор Смерть, не похож на серийного убийцу, тем не менее
этот человек поставил рекорд по убийствам. Тихий семейный врач,
работавший в пригороде Манчестера, в период с 1975 по 1998 год
ввел как минимум 215 пожилым пациентам смертельную дозу
опиатов. Но в конце концов он «прокололся», подделав завещание
одной

из

своих

жертв,

которая

якобы

оставила

ему

часть

наследства, что весьма насторожило ее дочь-адвоката. Проверка
компьютера врача показала, что он задним числом изменял
информацию в медицинских картах пациентов, чтобы состояние
их здоровья казалось хуже, чем было на самом деле. Он считался
увлеченным
технически

поборником
подкован,

технологий,

чтобы

но

не

был

достаточно

понимать,

что

время

каждого

внесенного изменения фиксируется (кстати, хороший пример
метаданных, раскрывающих скрытый смысл данных).
В результате эксгумации пятнадцати тел его пациентов (из тех,
которых не кремировали) в них были обнаружены смертельные
дозы диаморфина, медицинской формы героина. В 1999 году
Шипмана

судили

за

пятнадцать

убийств

и

приговорили

к

пожизненному заключению. Он не защищался и не произнес на
суде

ни

слова.

Впоследствии

было

инициировано

публичное

расследование, чтобы определить, какие еще преступления он мог
совершить, помимо рассмотренных в суде, и можно ли было
разоблачить его раньше. Я был одним из нескольких статистиков,
которых тогда привлекали к расследованию. Оно пришло к выводу,
1

что он определенно убил 215 пациентов, а, возможно, и еще 45 [3].
Эта книга посвящена применению статистики [4] для поиска
ответов на вопросы

(некоторые

из них выделены), которые

возникают, когда мы пытаемся лучше понять мир. Чтобы получить
представление о мотивах поведения Шипмана, вполне закономерно
спросить:
Каких

людей

убивал

Гарольд

Шипман,

и

когда

они

умирали?
В

ходе

упомянутого

расследования

была

представлена

информация о возрасте, поле и дате смерти каждой жертвы.
Рис. 0.1 –

довольно

сложная

визуализация

этих

данных,

отображающая возраст и дату смерти жертвы, при этом цвет точек
указывает на пол – мужской или женский. На осях добавлены
гистограммы, демонстрирующие распределение по возрасту (с
интервалом в пять лет).

2

Рис. 0.1
Диаграмма рассеяния, показывающая возраст и год смерти 215
подтвержденных жертв Гарольда Шипмана. По осям добавлены

3

гистограммы, демонстрирующие распределение по возрасту и году
совершения убийства

Даже беглый взгляд на рисунок позволяет сделать некоторые
выводы. Черных точек больше, чем белых, а значит, жертвами
Шипмана

в

основном

были

женщины.

Гистограмма

справа

демонстрирует, что возраст большинства жертв – 70–80 лет, но
разброс точек показывает, что, хотя изначально все жертвы были
пожилыми, впоследствии

появилось

несколько

более

молодых

пациентов. Гистограмма сверху четко показывает промежуток
примерно в 1992 году, когда убийств не происходило. Оказывается,
до этого Шипман имел общую практику с другими врачами, но
затем – возможно, чтобы избежать подозрений, – стал работать
один.

После

чего

его

деятельность

активизировалась,

что

и

отображено на верхней гистограмме.
Анализ случаев, выявленных в ходе расследования, приводит к
дальнейшим вопросам о том, как Шипман совершал убийства.
Определенная статистическая информация содержится в данных о
времени смерти жертв (указывалось в свидетельстве о смерти). На
рис. 0.2 сравниваются два линейных графика: время смерти
пациентов Шипмана и пациентов других местных --">

Оставить комментарий:


Ваш e-mail является приватным и не будет опубликован в комментарии.