Большие данные. Принципы и практика построения масштабируемых систем обработки данных: Марц, Уоррен
Big Data. Principles And Best Practices Of Scalable Real-Time Data Systems
В этой книге представлены теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. В ней рассматривается лямбда-архитектура, предназначенная для построения подобных систем, и на примере конкретного веб-приложения поясняются особенности реализаци
Полная аннотация
Все характеристики
Аннотация
В этой книге представлены теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. В ней рассматривается лямбда-архитектура, предназначенная для построения подобных систем, и на примере конкретного веб-приложения поясняются особенности реализации всех уровней этой архитектуры с помощью инструментальных средств вроде Hadoop, Cassandra и Storm. Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных.
Книга рассчитана на читателей, стремящихся освоить принципы построения систем больших данных и внедрить их на практике.
В крупномасштабных веб-приложениях, которые поддерживают работу социальных сетей, выполняют аналитику в реальном времени или поддерживают электронную торговлю, приходится обрабатывать большие массивы данных, объем и скорость обмена которыми превышают возможности информационных систем, основанных на традиционных базах данных. Для подобных приложений требуются архитектуры, в основе которых лежат кластеры машин для хранения и обработки данных любого объема и с любой скоростью. Правда, масштабируемость и простота не являются взаимоисключающими свойствами подобных архитектур.
Эта книга поможет читателю научиться строить системы больших данных, используя архитектуру, специально предназначенную для фиксации и анализа данных в масштабе веб.
В ней представлена простая для понимания и масштабируемая лямбда-архитектура, позволяющая разрабатывать информационные системы усилиями небольших команд. В книге даются теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. Помимо общей инфраструктуры для обработки больших данных, читатель может ознакомиться с конкретными технологическими и инструментальными средствами вроде Hadoop, Storm и баз данных типа NoSQL.
В этой книге рассматриваются следующие темы.
Введение в системы больших данных.
Описание особенностей обработки данных масштаба веб в реальном времени.
Применение инструментальных средств вроде Hadoop, Cassandra и Storm.
Возможность расширить свои знания и навыки за пределы традиционных баз данных.
Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных.
Об авторах
Натан Марц - создатель системы Apache Storm и инициатор применения лямбда-архитектуры для построения систем больших данных.
Джеймс Уоррен - архитектор-аналитик с квалификацией в области машинного обучения и научных расчетов.
Отзывы о книге
"Эта книга выходит за рамки отдельных инструментальных средств или платформ. Обязательна к прочтению всем, кто работает системами больших данных".
-Джонатан Эстерхази, компания Groupon
"Эта книга - подробный, снабженный примерами экскурс в лямбда-архитектуру под руководством ее изобретателя".
-Марк Фишер, компания Pivotal
"Книга содержит мудрость, которую можно приобрести только после выполнения многих проектов с большими данными. Обязательна для чтения".
-Педро Феррера Бертран, компания Datasalt
"Это фактическое руководство по рационализации обработки конвейера данных пакетами и почти в реальном времени".
-Алекс Холмс, автор книги Hadoop in Practice
Книга рассчитана на читателей, стремящихся освоить принципы построения систем больших данных и внедрить их на практике.
В крупномасштабных веб-приложениях, которые поддерживают работу социальных сетей, выполняют аналитику в реальном времени или поддерживают электронную торговлю, приходится обрабатывать большие массивы данных, объем и скорость обмена которыми превышают возможности информационных систем, основанных на традиционных базах данных. Для подобных приложений требуются архитектуры, в основе которых лежат кластеры машин для хранения и обработки данных любого объема и с любой скоростью. Правда, масштабируемость и простота не являются взаимоисключающими свойствами подобных архитектур.
Эта книга поможет читателю научиться строить системы больших данных, используя архитектуру, специально предназначенную для фиксации и анализа данных в масштабе веб.
В ней представлена простая для понимания и масштабируемая лямбда-архитектура, позволяющая разрабатывать информационные системы усилиями небольших команд. В книге даются теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. Помимо общей инфраструктуры для обработки больших данных, читатель может ознакомиться с конкретными технологическими и инструментальными средствами вроде Hadoop, Storm и баз данных типа NoSQL.
В этой книге рассматриваются следующие темы.
Введение в системы больших данных.
Описание особенностей обработки данных масштаба веб в реальном времени.
Применение инструментальных средств вроде Hadoop, Cassandra и Storm.
Возможность расширить свои знания и навыки за пределы традиционных баз данных.
Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных.
Об авторах
Натан Марц - создатель системы Apache Storm и инициатор применения лямбда-архитектуры для построения систем больших данных.
Джеймс Уоррен - архитектор-аналитик с квалификацией в области машинного обучения и научных расчетов.
Отзывы о книге
"Эта книга выходит за рамки отдельных инструментальных средств или платформ. Обязательна к прочтению всем, кто работает системами больших данных".
-Джонатан Эстерхази, компания Groupon
"Эта книга - подробный, снабженный примерами экскурс в лямбда-архитектуру под руководством ее изобретателя".
-Марк Фишер, компания Pivotal
"Книга содержит мудрость, которую можно приобрести только после выполнения многих проектов с большими данными. Обязательна для чтения".
-Педро Феррера Бертран, компания Datasalt
"Это фактическое руководство по рационализации обработки конвейера данных пакетами и почти в реальном времени".
-Алекс Холмс, автор книги Hadoop in Practice
Свернуть
Характеристики
Автор
Переводчик
Издательство
ID товара
537961
ISBN
978-5-8459-2075-1
Язык
Русский
Страниц
368 (Офсет)
Вес
598 г
Размеры
240x170x20 мм
Тип обложки
7Бц - твердая, целлофанированная (или лакированная)
Иллюстрации
Черно-белые
Все характеристики
Нет в продаже
Рецензии на книгу
Читали книгу? Как она вам?
Мы всегда рады честным, конструктивным рецензиям.
Покупатели 2

lulumix
19 марта 2017 в 2:50











Качество печати порадовало. Твердая обложка, белая бумага. Для сравнения форматов добавила фото с несколькими книгами той же серии (думала, что формат у всех один, чтобы красиво смотрелись на полке, но на удивление, все, как на подбор, разных размеров)))) Насчет отзыва по самой книге - смотрите фото содержания. Достат...
Понравилась рецензия?
Да

Kassavetes
22 июня 2016 в 22:14






Несколько фото представленного издания
Понравилась рецензия?
Да
Книги из жанра

8351 670 -50% Еще 16 дней
Антология машинного обучения. Важнейшие исследования в области ИИ за последние 60 лет
Сейновски Терренс Джей
2 3074 614 -50% Еще 16 дней
Анализ данных в науке и технике. Машинное обучение, динамические системы и управление
Брантон Стивен Л.
1 0542 108 -50% Еще 16 дней
Современные технологии интеллектуального анализа данных. Учебное пособие
Макшанов Андрей Владимирович