Дэвид Хэнд

Темные данные: Практическое руководство по принятию правильных решений в мире недостающих данных

Человечество научилось собирать, обрабатывать и использовать в науке, бизнесе и повседневной жизни огромные массивы данных. Но что делать с данными, которых у нас нет? Допустимо ли игнорировать то, чего мы не замечаем? Британский статистик Дэвид Хэнд считает, что это по меньшей мере недальновидно, а порой крайне опасно. В своей книге он выделяет 15 влияющих на наши решения и действия видов данных, которые остаются в тени. Например, речь идет об учете сигналов бедствия, которые могли бы подать жители бедных районов, если бы у них были смартфоны, о результатах медицинского исследования, которые намеренно утаили или случайно исказили, или о данных, ставших темными из-за плохого набора критериев для включения в выборку. Хэнд также рассказывает о том, какие меры могут сгладить эффект темных данных и как их можно обратить себе на пользу.
383 trykte sider
Copyrightindehaver
Bookwire
Oprindeligt udgivet
2023
Udgivelsesår
2023
Har du allerede læst den? Hvad synes du om den?
👍👎

Vurderinger

  • a burmistrovahar delt en vurderingfor 3 år siden
    👍Værd at læse
    💡Lærerig
    🎯Læseværdig

    Обязательное чтение для всех, кто взаимодействует с данными (то есть для всех)

  • Дмитрий Яковлевhar delt en vurderingfor 4 år siden
    👍Værd at læse
    🎯Læseværdig
    🚀Opslugende

    Мне просто взорвал мозг тот факт, что из-за хранения большинства данных, которые никак не используются и не поддаются категоризации (!) в будущем планета столкнётся с экологическими проблемами. Вообще мы так привыкли что "интернет бесконечен" и что там хранится всё, что забываем о том, во что обойдётся этот ресурс нашим потомкам. В общем, это одна из лучших и самых оригинальных науч-поп книг за последнее время

  • Vladimir Martynovhar delt en vurderingfor 4 år siden
    💡Lærerig

    Необычно. Местами было тяжело, но безумно интересно пробираться через текст. Если вы боитесь цифр и специальных терминов, то книгу за вечер не осилить. Но она определённо стоит потраченного времени. Мне она дала "карту" того, где хранятся все цифровые данные. Полезно для любой деятельности в сети: бизнес, соц.сети, информационная безопасность и конфиденциальность

Citater

  • Dmitry Koltunovhar citeretfor 2 år siden
    Давайте обратимся к классической статье по этой проблеме, написанной Крейгом Беннеттом и его коллегами, которая гораздо интереснее, чем можно ожидать судя по названию: «Нейронные корреляции межвидового восприятия, полученные после смерти атлантического лосося: аргумент в пользу коррекции множественных сравнений»18. Статья основана на результатах МРТ-сканирования мозга мертвого лосося, которому «показали серию фотографий, изображающих людей в различных ситуациях и… попросили определить, какие эмоции они испытывают». Вероятно, вы и без экспериментальных данных уже сделали свой вывод о реакции мозга мертвого лосося на показ фотографий. Но дело в том, что результат МРТ-сканирования представляет собой примерно 130 000 элементов объемного изображения, которые по аналогии с двумерными пикселями называют вокселями. И каждый из этих вокселей имеет небольшой шанс показать электрическую активность сканируемого материала исключительно в силу случайных фоновых шумов оборудования, а вовсе не потому, что клетки мозга мертвого лосося действительно реагируют. И хотя отдельно взятый воксель имеет лишь крошечный шанс дать ложный сигнал, вероятность его появления резко возрастает с учетом большого количества самих вокселей. Суммируйте огромное число крошечных шансов, и вот уже один, а то и более вокселей показывают электрическую активность, создавая впечатление, что некоторые нейроны мозга лосося активизируются, даже если сам лосось мертв. И действительно, Беннетт и его коллеги обнаружили несколько вокселей, подающих явные сигналы. В результате они пришли к такому выводу: «Либо мы наткнулись на поразительное открытие на стыке ихтиологии и посмертных когнитивных функций, либо что-то не так с нашим статистическим подходом.
  • George Mazurkevichhar citeretfor 3 år siden
    различие определений этих данных является фундаментальным и невозможно обеспечить согласование двух типов учета, просто “складывая” и “вычитая”
  • George Mazurkevichhar citeretfor 3 år siden
    В 2018 г. ежегодная инвентаризация в лондонском зоопарке, которая занимает около недели, показала, что в данной организации насчитывается 19 289 животных — от филиппинских крокодилов до беличьих обезьян, пингвинов Гумбольдта и двугорбых верблюдов (в случае муравьев, пчел и других социальных насекомых подсчитывались колонии).

På boghylderne

fb2epub
Træk og slip dine filer (ikke mere end 5 ad gangen)