- Введение в HBase
- Немного о Hadoop и NoSQL. Hive и HBase. NoSQL
- Архитектура HBase. Модель данных HBase: Column family, timestamp, версионность
- Сервисы и операторы HBase. Концепция CRUD: базовые операции с таблицами
- Сценарии использования HBase
- Импорт данных и интеграция с HBase
- Импорт данных с использованием importTSV
- Взаимодействие компонент Hadoop и HBase: HDFS, PIG, Hive, sqoop, Impala
- Хранение файлов в HDFS. Форматы файлов для HDFS: параметры сжатия, ORC, Parquet
- Использование Java API для работы с HBase
- Установка и настройка HBase
- Требования по установке HBase
- Дизайн схемы HBase для эффективного хранения данных и HA
- Установка Apache HBase
- Команды и интерфейс командной строки HBase: HBaseAdmin
- Ручная установка кластера HBase. Настройка кластера Zookeeper
- Управление кластером HBase
- Высокая доступность (High Availability) кластера HBase. Настройка Snapshots. Настройка репликации кластера
- Безопасность HBase. Настройка аутентификации и авторизации при доступе к данным в таблицах HBase
- Резервное копирование и восстановление HBase
- Advanced HBase
- Мониторинг Apache HBase. Анализ лог файлов HBase
- Операции обслуживания. Compactions и flushes
- Оптимизация параметров HBase: Hfile, WAL, Memstores, Bloom фильтр
- Диагностика и разрешение проблем (troubleshooting). Мониторинг и оптимизация JVM. Garbage Collection
- Region splitting