Брат Тук
Брат Тук

Брат Тук

Редактор
badge 1 год с нами! badge Награда за 5000 очков репутации badge За 500 сообщений!
Регистрация
18/04/2023
Сообщения
9.996
Репутация
12.869
Автор: bigdata team
Название: Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive (2023)

[bigdata team] Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive (2023)


Описание:

Кому подойдет этот курс

  • Разработчикам
    Вы программируете, но хотите расширить профессиональные возможности и получить практические навыки работы с большими данными? На курсе вы научитесь работать с Hadoop, MapReduce, Hive, Spark, Kafka, Cassandra и будете выполнять задания на реальном кластере.

  • Data Engineers
    Хотите расширить свой арсенал для работы с данными и структурировать свои знания в DE? Вы узнаете о современных технологиях работы с Big Data, научитесь грамотно их использовать и понимать, какую технологию в каких случаях лучше применять.

  • Аналитикам
    Хотите освоить работу с большими данными, чтобы решать более сложные и интересные аналитические задачи? Вы научитесь использовать инструменты работы с большими данными, проводить аналитику с помощью SQL и NoSQL инструментов, готовить данные и отчеты на основе больших массивов информации.

  • Data Scientists
    Ловите себя на мысли, что качество модели во многом зависит от правильного сбора и предобработки данных? Вы получите базу по современным инструментам и подходам, необходимым для сбора, хранения и обработки данных; изучите особенности укладки данных для оптимизации вычислений, подготовки фичей и масштабирования ML-моделей.
Вы научитесь работать с распределенными файловыми системами, познакомитесь с экосистемой Hadoop, разберетесь с оптимизацией MapReduce вычислений и работой с Hive.

Часть 1.
HDFS, Map Reduce, Hive

В этом модуле вы изучите:

▶ вводная часть: знакомство (задачи, оценки, дедлайны), подробности курса;
▶ распределенные файловые системы (GFS, HDFS). Их составляющие, достоинства, недостатки и сфера применения;
▶ чтение и запись в HDFS. HDFS APIs: Web, shell.
▶ Hadoop Streaming;
▶ элементы Hadoop-задачи (Mapper, reducer, combiner, partitioner, comparator).
▶ приложения с несколькими Hadoop-задачами;
▶ тюнинг Hadoop-job (настройка партиционирования, сложные ключи, uber jobs);
▶ задачи с несколькими входами. Joins в Hadoop.
▶ архитектура Hive, виды таблиц, форматы хранения данных;
▶ трансляция Hive-запросов в MapReduce-задачи;
▶ сериализация и десериализация;
▶ тюнинг Join'ов в Hive;
▶ партиционирование, бакетирование, семплирование;
▶ User defined functions, Hive Streaming.

Подробнее:
Авторизуйтесь, чтобы посмотреть скрытый контент.

Скачать:
Авторизуйтесь, чтобы посмотреть скрытый контент.
 
пропущены лекции в этой части
после первой следующая 5ая
 

Создайте учетную запись или войдите, чтобы комментировать или скачивать материалы!

У вас должна быть учетная запись, чтобы оставлять комментарии

Зарегистрироваться

Создайте учетную запись. Это просто!

Авторизоваться

У вас уже есть аккаунт? Войдите здесь.

Последние темы автора

Брат Тук
Ответы
0
Просмотры
615
Брат Тук
Брат Тук
Брат Тук
Ответы
1
Просмотры
714
МИринаМ
Брат Тук
Ответы
0
Просмотры
584
Брат Тук
Брат Тук
Брат Тук
Ответы
0
Просмотры
474
Брат Тук
Брат Тук
Брат Тук
Ответы
1
Просмотры
511
Els i El

Похожие темы

Брат Тук
Ответы
3
Просмотры
2K
Sergey_K
Брат Тук
Ответы
0
Просмотры
1K
Брат Тук
Брат Тук
Брат Тук
Ответы
0
Просмотры
2K
Брат Тук
Брат Тук
Брат Тук
Ответы
0
Просмотры
901
Брат Тук
Брат Тук
Брат Тук
Ответы
3
Просмотры
3K
Дева Мэриан
Дева Мэриан
Дева Мэриан
Ответы
12
Просмотры
8K
asoft
Брат Тук
Ответы
1
Просмотры
2K
Superporn
Superporn
Малыш Джон
Ответы
6
Просмотры
15K
Irishochek
Брат Тук
Ответы
0
Просмотры
2K
Брат Тук
Брат Тук
Брат Тук
Ответы
1
Просмотры
1K
Els i El
Сверху Снизу