![Dr. Dre](/data/avatars/m/124/124518.jpg?1641197806)
Dr. Dre
Модератор
- Регистрация
- 02.10.20
- Сообщения
- 65,232
- Реакции
- 168,658
- #1
Голосов: 0
Автор: Олег Ивченко [МФТИ] [HDFS]
Название: Hadoop Distributed File System (2021)
Hadoop Distributed File System (HDFS) [2021]
МФТИ (ФПМИ МФТИ Физтех-школа прикладной математики и информатики)
Олег Ивченко
Освойте основные операции с файловой системой HDFS.
Какие перспективы открывают навыки работы с HDFS:
1. На интенсиве вы узнаете о среде для работы с большими данными - Apache Hadoop, а также научитесь работать с основополагающим компонентом фреймворка Apache Hadoop: HDFS.
2. Hadoop Distributed File System (HDFS) – распределённая файловая система, позволяющая хранить информацию практически неограниченного объёма. HDFS является неотъемлемой частью экосистемы Hadoop, куда входят фреймворки Spark, Hive, HBase и другие. Hadoop Distributed File System активно используют и другие направления Big Data, включая подготовку и анализ данных, а также аналитические системы на базе алгоритмов машинного обучения (Machine Learning).
Кому будет полезен интенсив:
1. Тем, кто начинает погружаться в сферу BigData
2. Тем, кто хочет глубже узнать внутреннее устройство распределенной файловой системы HDFS
После интенсива вы будете:
1. Понимать, зачем нужны большие данные (Big Data)
2. Разбираться, как устроена HDFS, ее составляющие
3. Знать преимущества и недостатки HDFS
4. Уметь записывать и читать данные в/из HDFS
5. Исследовать файловую систему HDFS с точки зрения системного администратора
Содержание:
1. Зачем нужны большие данные
2. Распределённые файловые системы. Файловые системы HDFS. Их составляющие. Их достоинства, недостатки и сфера применения
3. Чтение и запись в HDFS
4. HDFS APIs: Web API, shell, Python API.
5. Форма закрепления знаний - тестирование и выполнение домашней работы
Подробнее:
Скачать:
Материал может быть удалён по требованию правообладателя
Название: Hadoop Distributed File System (2021)
Hadoop Distributed File System (HDFS) [2021]
МФТИ (ФПМИ МФТИ Физтех-школа прикладной математики и информатики)
Олег Ивченко
Освойте основные операции с файловой системой HDFS.
Какие перспективы открывают навыки работы с HDFS:
1. На интенсиве вы узнаете о среде для работы с большими данными - Apache Hadoop, а также научитесь работать с основополагающим компонентом фреймворка Apache Hadoop: HDFS.
2. Hadoop Distributed File System (HDFS) – распределённая файловая система, позволяющая хранить информацию практически неограниченного объёма. HDFS является неотъемлемой частью экосистемы Hadoop, куда входят фреймворки Spark, Hive, HBase и другие. Hadoop Distributed File System активно используют и другие направления Big Data, включая подготовку и анализ данных, а также аналитические системы на базе алгоритмов машинного обучения (Machine Learning).
Кому будет полезен интенсив:
1. Тем, кто начинает погружаться в сферу BigData
2. Тем, кто хочет глубже узнать внутреннее устройство распределенной файловой системы HDFS
После интенсива вы будете:
1. Понимать, зачем нужны большие данные (Big Data)
2. Разбираться, как устроена HDFS, ее составляющие
3. Знать преимущества и недостатки HDFS
4. Уметь записывать и читать данные в/из HDFS
5. Исследовать файловую систему HDFS с точки зрения системного администратора
Содержание:
1. Зачем нужны большие данные
2. Распределённые файловые системы. Файловые системы HDFS. Их составляющие. Их достоинства, недостатки и сфера применения
3. Чтение и запись в HDFS
4. HDFS APIs: Web API, shell, Python API.
5. Форма закрепления знаний - тестирование и выполнение домашней работы
Подробнее:
Скачать:
Материал может быть удалён по требованию правообладателя
Похожие темы
- [Codemoon] [Stepik] Создаем корпоративного Telegram бота на Python с ChatGPT внутри (2024)
- [Сергей Спирёв] [Stepik] Библиотека Matplotlib. Визуализация данных в Python (2024)
- [Hayk Inants] [Stepik] SQL для начинающих. Часть 3 (2024)
- [Себастьян Рашка и др.] [БХВ] Машинное обучение с PyTorch и Scikit-Learn (2023)
- [Дэвид Вонг] [Питер] Реальная криптография (2024)
- [Джим Лемер] [Питер] Нечеткое сопоставление данных в SQL (2024)
- [Ержан Елемесов] [Udemy] Data Science от Проблемы до Решения (2024)
- [Андрей Суховицкий] [Udemy] RabbitMQ - Базовые и продвинутые концепты. Event driven (2024)
- [Богдан Кухар] 1C 8.3 Старт 2 Pro (2024)
- [Тимур Гуев, Школа BEEGEEK] Поколение Python: базы данных и SQL для начинающих (2024)