Роман Зыков

Роман с Data Science. Как монетизировать большие данные

  • jbmeerkathar citeretfor 4 år siden
    Считается, что нужно потратить 10 000 часов для того, чтобы стать очень хорошим специалистом в своей области.

    Популярное заблуждение. Можно и сто тысяч часов потратить и не стать высококвалифицированным профессионалом. Важно как именно время потрачено, а количество вторично.

    Интересно то, что Малкольм Гладуэлл, который популяризовал это утверждения, основывался на исследовании психолога Андерса Эрикссона, который, в свою очередь, раскритиковал Гладуэлла за неверную трактовку его исследования. Согласно исследованию это среднее количество времени, которое высококлассные профессионалы потратили на достижение своего уровня, но много и тех, кто потратил меньше, и огромное количество тех, кто потратил больше и немногого добился. Подробнее про то, какой должна быть практика для достижения результата Эрикссон написал в книге «Peak».

  • Serhii Mazurokhar citeretfor 4 år siden
    А для статистического усреднения человек как таковой совершенно не важен. Это — абстракция, а не конкретная личность.
  • Oleg Kopylovhar citeretfor 2 år siden
    существует единственного алгоритма, который будет самым точным для любых задач
  • Oleg Kopylovhar citeretfor 2 år siden
    Теорема No Free Lunch (или по-нашему — халявы не бывает) гласит, что не
  • Oleg Kopylovhar citeretfor 2 år siden
    Как я уже писал, основное отличие машинного обучения от обычного программирования заключается в том, что программа обучается на примерах, а не на прямых инструкциях. Поэтому неотъемлемой частью какого-либо решения является обученная на данных (примерах) модель
  • Oleg Kopylovhar citeretfor 2 år siden
    Как вы помните из предыдущих глав, классическая аналитика данных делится на два этапа — поиск гипотез и их статистическая проверка. Для формирования гипотез нам понадобятся описательная статистика, визуализация данных и доменные знания, например, какие события в компании произошли
  • b1178325954har citeretfor 2 år siden
    В аналитический паралич легко впасть, если пытаться принять решение чисто рационально, руководствуясь только логикой.
  • Oleg Kopylovhar citeretfor 2 år siden
    Я всегда стараюсь использовать этот подход во всех компаниях, где бы ни работал. Вы даже не представляете, насколько будут вам благодарны пользователи ваших аналитических систем, когда смогут получать данные самостоятельно. Самые умные и деятельные сотрудники являются самыми активными потребителями информации для принятия решений, и создавать им препятствия — это преступление
  • Oleg Kopylovhar citeretfor 2 år siden
    что в эпоху облачных вычислений, дешевого хранения данных и хороших алгоритмов их сжатия нужно сохранять максимально много и подробно. Поверьте, когда понадобится найти ответ на какой-то вопрос и вы будете понимать, что данных нет, а могли бы быть, будет очень обидно. Рано или поздно собирать их все равно придется, почему бы не начать прямо сейчас
  • Oleg Kopylovhar citeretfor 2 år siden
    Много данных не бывает
    Эту фразу я повторял, когда работал в Ostrovok.ru.
fb2epub
Træk og slip dine filer (ikke mere end 5 ad gangen)