Современный скрапинг веб-сайтов с помощью Python: Райан Митчелл
Web Scraping with Python. Collecting More Data from the Modern Web
16+
Если программирование напоминает волшебство, то веб-скрапинг - это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги з
Полная аннотация
Все характеристики
Аннотация
Если программирование напоминает волшебство, то веб-скрапинг - это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.
В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.
- Разбирайте сложные HTML-страницы.
- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.
- Изучайте методы хранения данных, полученных с помощью скрапинга.
- Считывайте и извлекайте данные из документов.
- Очищайте и нормализуйте плохо отформатированные данные.
- Читайте и пишите информацию на естественных языках.
- Освойте поиск по формам и логинам.
- Изучите скрапинг JavaScript и работу с API.
- Используйте и пишите программы для преобразования изображений в текст.
- Учитесь обходить скрапинговые ловушки и блокаторы ботов.
- Протестируйте собственный сайт с помощью скрапинга.
2-е международное издание.
В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.
- Разбирайте сложные HTML-страницы.
- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.
- Изучайте методы хранения данных, полученных с помощью скрапинга.
- Считывайте и извлекайте данные из документов.
- Очищайте и нормализуйте плохо отформатированные данные.
- Читайте и пишите информацию на естественных языках.
- Освойте поиск по формам и логинам.
- Изучите скрапинг JavaScript и работу с API.
- Используйте и пишите программы для преобразования изображений в текст.
- Учитесь обходить скрапинговые ловушки и блокаторы ботов.
- Протестируйте собственный сайт с помощью скрапинга.
2-е международное издание.
Свернуть
Характеристики
Автор
Переводчик
Издательство
Серия
Жанр
ID товара
790533
ISBN
978-5-4461-1693-5
Страниц
336 (Офсет)
Вес
450 г
Размеры
235x165x15 мм
Тип обложки
обл - мягкий переплет (крепление скрепкой или клеем)
Иллюстрации
Черно-белые
Все характеристики
Нет в продаже
Рецензии на книгу
Читали книгу? Как она вам?
Мы всегда рады честным, конструктивным рецензиям.
Покупатели 1

Дмитрий Хапенков
26 марта 2021 в 6:16
Пишу, как человек, который занимался парсингом больше 10 лет, но на других языках. Решил взять, чтобы сразу привыкнуть к инструментам на питоне, ну и вдруг чего новое бы узнал.
Честно говоря, книга несколько неоднозначна. В целом, основные моменты парсинга упомянуты, как введение в тему - нормально. Но многое упомя...
Понравилась рецензия?
Да
Книги из жанра

1 0132 026 -50% Еще 4 дня
Цифровизация процессов управления медико-гигиеническими рисками на производственных предприятиях
Шипилов Игорь Викторович