ru
Классен М. .,Рассел М. .

Data mining. Извлечение информации из Facebook, Twitter, LinkedIn, Instagram, GitHub

Giv mig besked når bogen er tilgængelig
Denne bog er ikke tilgængelig i streaming pt. men du kan uploade din egen epub- eller fb2-fil og læse den sammen med dine andre bøger på Bookmate. Hvordan overfører jeg en bog?
В недрах популярных социальных сетей — Twitter, Facebook, LinkedIn и Instagram — скрыты богатейшие залежи информации. Из этой книги исследователи, аналитики и разработчики узнают, как извлекать эти уникальные данные, используя код на Python, Jupyter Notebook или контейнеры Docker. Сначала вы познакомитесь с функционалом самых популярных социальных сетей (Twitter, Facebook, LinkedIn, Instagram), веб-страниц, блогов и лент, электронной почты и GitHub. Затем приступите к анализу данных на примере Twitter. Прочитайте эту книгу, чтобы • Узнать о современном ландшафте социальных сетей • Научиться использовать Docker, чтобы легко оперировать кодами, приведенными в книге; • Узнать, как адаптировать и поставлять код в открытый репозиторий GitHub; • Научиться анализировать собираемые данные с использованием возможностей Python 3; • Освоить продвинутые приемы анализа, такие как TFIDF, косинусное сходство, анализ словосочетаний, определение клика и распознавание образов; • Узнать, как создавать красивые визуализации данных с помощью Python и JavaScript. Мэтью Рассел (Matthew Russell) — директор Built Technologies, он возглавляет команду лидеров, работающую над улучшением нашего мира. Вне работы Мэтью рациональный индивидуалист, готовящийся к возможному зомби-апокалипсису. Михаил Классен (Mikhail Klassen) — главный специалист по обработке и анализу данных в Paladin AI, стартапе, занимающемуся адаптивными технологиями обучения. Он увлекается проблемами искусственного интеллекта и анализом данных. Когда Михаил не занят на работе, он любит читать и путешествовать.
Denne bog er ikke tilgængelig i øjeblikket
694 trykte sider
Har du allerede læst den? Hvad synes du om den?
👍👎

Citater

  • Евгения Шварцhar citeretfor 5 år siden
    Библиотека pandas для Python — важный инструмент в арсенале любого исследователя данных, и мы будем использовать ее далее в этой книге. Она предлагает высокопроизводительные структуры данных для хранения табличных данных и мощные средства анализа, написанные на Python, при этом некоторые части библиотеки, выполняющие особенно интенсивные вычисления, написаны на C или Cython. Разработка библиотеки была начата в 2008 году Уэсом Маккинни (Wes McKinney), и первоначально она предназначалась для анализа финансовых данных.
  • Евгения Шварцhar citeretfor 5 år siden
    Существует совершенно отдельный вид анализа, известный как разрешение сущностей (или устранение неоднозначности сущностей, в зависимости от формулировки задачи), помогающий объединить упоминания предметов в одно номинальное понятие. Например, в данном случае процесс разрешения сущностей мог бы заметить, что в Open Graph имеется несколько узлов, в действительности ссылающихся на одно и то же номинальное понятие Mining the Social Web, и создать связи между ними, указав, что в действительности они представляют одну и ту же сущность в реальном мире

På boghylderne

fb2epub
Træk og slip dine filer (ikke mere end 5 ad gangen)