Big Data on AWS

【課程資訊】
  • 課程天數:3 天

  • 費用:NTD 28,350(含稅)

Big Data on AWS 介紹以雲端為基礎的大數據解決方案,例如 Amazon EMR、Amazon Redshift、Amazon Kinesis 及其他 AWS 大數據平台。在本課程中,我們為您介紹如何使用 Amazon EMR 以 Hive 和 Hue 這類廣泛的 Hadoop 工具生態系統處理資料。授課內容還包括如何建立大數據環境,使用 Amazon DynamoDB、Amazon Redshift、Amazon Quicksight、Amazon Athena 和 Amazon Kinesis,以及利用最佳實務來設計具安全性和成本效益的大數據環境。

【目標對象】
  • 負責設計和實作大數據解決方案的個人,即解決方案架構師
  • 對了解 AWS 大數據解決方案背後服務和架構模式感興趣的資料科學家和資料分析師
【課程目標】

您在本課程中將學習:

  • 將 AWS 解決方案融入大數據生態系統
  • 利用 Amazon EMR 環境中的 Apache Hadoop
  • 識別 Amazon EMR 叢集的元件
  • 啟動和設定 Amazon EMR 叢集
  • 利用 Amazon EMR 的常用程式設計框架,包括 Hive、Pig 和 Streaming
  • 利用 Hue 改善 Amazon EMR 的易用性
  • 在 Amazon EMR 透過 Spark 使用記憶體內分析
  • 選擇適當的 AWS 資料儲存體選項
  • 識別針對幾乎即時的大數據處理使用 Amazon Kinesis 的好處
  • 利用 Amazon Redshift 有效率地存放和分析資料
  • 了解和管理大數據解決方案的費用和安全
  • 保護大數據解決方案的安全
  • 識別導入、傳輸和壓縮資料等選項
  • 將 Amazon Athena 用於臨機操作查詢分析
  • 透過 Amazon QuickSight 使用視覺化軟體描述資料和查詢
  • 使用 AWS Data Pipeline 協調大數據工作流程
【課程大綱】

本課程涵蓋下列概念:
第 1 天

  • 大數據概觀
  • 大數據導入和傳輸
  • 大數據串流和 Amazon Kinesis
  • 實驗室 1:使用 Amazon Kinesis 串流和分析 Apache 伺服器日誌資料
  • 大數據儲存解決方案
  • 大數據處理和分析
  • 實驗室 2:使用 Amazon Athena 查詢來自 Amazon S3 的日誌資料

第 2 天

  • Apache Hadoop 和 Amazon EMR
  • 實驗室 3:在 Amazon DynamoDB 上存放和查詢資料
  • 使用 Amazon EMR
  • Hadoop 程式設計框架
  • 實驗室 4:在 Amazon EMR 以 Hive 處理伺服器日誌
  • Amazon EMR 上的 Web 界面
  • 實驗室 5:在 Amazon EMR 上的 Hue 執行 Pig 指令碼
  • Amazon EMR 上的 Apache Spark
  • 實驗室 6:在 Amazon EMR 上使用 Spark 處理紐約計程車資料

第 3 天

  • Amazon Redshift 和大數據
  • 大數據的視覺化及編製
  • 實驗室 7:使用 TIBCO Spotfire 視覺化資料
  • 管理大數據成本
  • 保護 Amazon 部署的安全
  • 大數據設計模式
【開課日期】

TW - Website - Training/ Big Data on AWS

2019-01-03T16:51:06+00:00