Dr. Dre
Модератор
- Регистрация
- 02.10.20
- Сообщения
- 67,593
- Реакции
- 136,052
- #1
Голосов: 0
Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.
В этом модуле вы изучите:
- подходы к Realtime-обработке;
- гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
- Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
- архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
- семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
- отличия Key-Value хранилищ от реляционных БД;
- компактификация и её виды, CQLSH;
- архитектура Cassandra;
- обеспечение надёжности и высокодоступности в Key-Value хранилищах;
- интеграция Spark с Cassandra.
- как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
- trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
- форматы данных в Big Data: ORC vs Parquet, Avro, ...
Курс ведет: BigData Тeam
О курсе от автора:
Скачать материалы курса:
Материал может быть удалён по требованию правообладателя
Похожие темы
- [Stepik] SQL для анализа данных (2024)
- [Stepik] Python. Микросервисы. Backend на FastAPI (2024)
- [Андрей Сумин] [Stepik] Java с нуля до Junior + Подготовка к собеседованию (2024)
- [HTML Academy] Профессиональный онлайн-курс Vite (2024)
- [Thinknetica] Владимир Дементьев ― Профилирование и оптимизация тестов Rails-приложений (2024)
- [Илья Карельцев] [Eccentric Games] Основы создания игры на Unity (2024)
- [Евгений Окулик] Автоматизация тестирования на Python. Тариф Без домашних заданий (2024)
- [Вадим Сайфутдинов] Создание бота Telegram. Обмен между 1С и мессенджером Telegram через API (2024)
- [AreaWeb] Laravel - лучшее, что сделал Тейлор (2024)
- [Stepik] Запросы в 1С: Углубленное изучение языка запросов (2024)