BDAWS |

Big Data on AWS

Descrizione

Cegeka e beSharp propongono il corso Big Data on AWS. In questo corso, verranno presentate le soluzioni per i Big Data basate su cloud come Amazon EMR, Amazon Redshift, Amazon Kinesis e gli altri servizi della piattaforma per i Big Data di AWS. Verrà illustrato come utilizzare Amazon EMR per elaborare dati con il vasto ecosistema degli strumenti Hadoop quali Hive e Hue. Inoltre, verrà spiegato come creare ambienti per i Big Data, come utilizzare Amazon DynamoDB, Amazon Redshift, Amazon QuickSight, Amazon Athena e Amazon Kinesis, e come applicare le best practice per la progettazione di ambienti per i Big Data in modo da ottenere massima sicurezza e costi contenuti.

Dettagli Corso

PERSONALIZZA:
Promozioni:
Calendario:
Sede:
Milano, Roma, Padova, Online
DURATA:
3 giorni

Destinatari

  • Responsabili della progettazione e dell'implementazione di soluzioni big data, ovvero Solutions Architects e amministratori SysOps
  • Data Scientist e Data Analyst interessati a conoscere le soluzioni Big Data su AWS
Obiettivi

Al termine del corso i partecipanti saranno in grado di:

  • Utilizzare Apache Hadoop con Amazon EMR
  • Avviare e configurare un cluster Amazon EMR
  • Utilizzare framework di programmazione comuni per Amazon EMR, tra cui Hive, Pig e Streaming
  • Utilizzare Hue per migliorare la facilità d'uso di Amazon EMR
  • Utilizzare l'analisi in memoria con Spark su Amazon EMR
  • Comprendere in che modo servizi come AWS Glue, Amazon Kinesis, Amazon Redshift, Amazon Athena e
  • Utilizzare Amazon QuickSight anche con carichi di lavoro Big Data
  • Familiarità di base con le tecnologie di Big Data, tra cui Apache Hadoop, MapReduce, HDFS e query SQL/NoSQL
  • Aver completato la formazione web di Big Data Technology Fundamentals o avere un'esperienza equivalente
  • Conoscenza del lavoro dei servizi AWS di base e dell'implementazione del cloud pubblico
  • Aver completato il corso AWS Technical Essentials (AWSE) o avere un'esperienza equivalente
  • Conoscenza di base del data warehousing, dei sistemi di database relazionali e della progettazione di database

Module 1: Overview of Big Data 

  • What is big data
  • The big data pipeline
  • Big data architectural principals

 

Module 2: Big Data ingestion and transfer 

  • Overview: Data ingestion
  • Transferring data

 

Module 3: Big data streaming and Amazon Kinesis 

  • Stream processing of big data
  • Amazon Kinesis
  • Amazon Kinesis Data Firehose
  • Amazon Kinesis Video Streams
  • Amazon Kinesis Data Analytics

 

Module 4: Big data storage solutions 

  • AWS data storage options
  • Storage solutions concepts
  • Factors in choosing a data store

 

Module 5: Big data processing and analytics 

  • Big data processing and analytics
  • Amazon Athena

 

Module 6: Apache Hadoop and Amazon EMR 

  • Introduction to Amazon EMR and Apache Hadoop
  • Best practices for ingesting data
  • Amazon EMR
  • Amazon EMR architecture

 

Module 7: Using Amazon EMR 

  • Developing and running your application
  • Launching your cluster
  • Handling output from your completed jobs

 

Module 8: Hadoop programming frameworks 

  • Hadoop frameworks
  • Other frameworks for use on Amazon EMR

 

Module 9: Web interfaces on Amazon EMR 

  • Hue on Amazon EMR
  • Monitoring your cluster

 

Module 10: Apache Spark on Amazon EMR 

  • Apache Spark
  • Using Spark

 

Module 11: Using AWS Glue to automate ETL workloads 

  • What is AWS Glue?
  • AWS Glue: Job orchestration

 

Module 12: Amazon Redshift and big data 

  • Data warehouses vs. traditional databases
  • Amazon Redshift
  • Amazon Redshift architecture

 

Module 13: Securing your Amazon deployments 

  • Securing your Amazon deployments
  • Amazon EMR security overview
  • AWS Identity and Access Management (IAM) overview
  • Securing data
  • Amazon Kinesis security overview
  • Amazon DynamoDB security overview
  • Amazon Redshift security overview

 

Module 14: Managing big data costs 

  • Total cost considerations for Amazon EMR
  • Amazon EC2 pricing models
  • Amazon Kinesis pricing models
  • Cost considerations for Amazon DynamoDB
  • Cost considerations and pricing models for Amazon Redshift
  • Optimizing cost with AWS

 

Module 15: Visualizing and orchestrating big data 

  • Visualizing big data
  • Amazon QuickSight
  • Orchestrating a big data workflow

 

Module 16: Big data design patterns 

  • Common architectures

 

Module 17: Course wrap-up 

  • What’s next?

Recensioni

Lascia una recensione

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Corso personalizzato?

Mai stato così semplice!
Big Data on AWS su misura per te

Calendario

Richiedi informazioni

Mai stato così semplice!
Big Data on AWS su misura per te