Вы научитесь работать с распределенными файловыми системами, познакомитесь с экосистемой Hadoop, разберетесь с оптимизацией MapReduce вычислений и работой с Hive.
Часть 1.
HDFS, Map Reduce, Hive
В этом модуле вы изучите:
вводная часть: знакомство (задачи, оценки, дедлайны), подробности курса;
распределенные файловые системы (GFS, HDFS). Их составляющие, достоинства, недостатки и сфера применения;
чтение и запись в HDFS. HDFS APIs: Web, shell.
Hadoop Streaming;
элементы Hadoop-задачи (Mapper, reducer, combiner, partitioner, comparator).
приложения с несколькими Hadoop-задачами;
тюнинг Hadoop-job (настройка партиционирования, сложные ключи, uber jobs);
задачи с несколькими входами. Joins в Hadoop.
архитектура Hive, виды таблиц, форматы хранения данных;
трансляция Hive-запросов в MapReduce-задачи;
сериализация и десериализация;
тюнинг Join’ов в Hive;
партиционирование, бакетирование, семплирование;
User defined functions, Hive Streaming.

  1. Главная
  2. /
  3. Администрирование и программирование
  4. /
  5. [bigdata team] Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive

[bigdata team] Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive

584  руб.
  • 🎯 Лучшее качество материала. Оригинальные курсы отличного качества со скидкой до 99%
  • 📩Моментальная обработка заказа. Доступ пpeдоcтавляeтcя нa oблaчном хранилищe.
  • 📂Пoсле оплaты открывается доступ к ссылке на облачное хранилище откудa Вы можетe поcмoтреть onlinе или скaчaть.
  • 👍 Гарантия получения результата.  Все обучение добавленное на проекте выкуплено и полностью в наличии
  • Надежная оплата несколько вариантов на выбор: платите как вам удобно

      

Популярные инфопродукты от блогеров 💪

Многослойное окрашивание брашированного дерева (Анна Турчина)
Разные способы состаривания брашированного дерева (Анна Турчина)