스파크로 구축하는 분산처리 빅데이터 플랫폼

logo
빅데이터 플랫폼,Hadoop Ecosystem 기술,HDFS, Mapreduce를 이해하고 하드웨어나 네트워크 등 실제 빅데이터 플랫폼 방법을 이해합니다. Spark 기본적인 사용법 및 기술을 이해하여 빠른 데이터 분석을 위한 Spark RDD, SQL Stream, ML 등을 실습합니다. Hadoop, Spark를 이용하여 데이터 적재, 처리, 분석, 머신러닝까지 빅데이터 분석과 모델링 과정을 다룹니다.
calendar
학습 목표
• Hadoop Ecosystem이해하기 • Spark 기초 및 실무 적용하기 • Spark SQL, 스트리밍으로 데이터 처리, 머신러닝 적용
calendar
수강대상
• IT/보안 분야에 종사하시는 분 • 조직의 빅데이터 플랫폼에 관심 있는 분 • 조직이 스파크에 통한 데이터 처리에 관심 있으신 분 • 스파크 SQL로 쿼리하여 데이터 처리에 관심이 있는 분 • 스파크로 머신러닝에 활용에 관심이 있는 분
calendar
교육 일정
  • 시작일 : 2026년 1월 5일 ~ 종료일 : 2026년 1월 9일
  • 시작 시간 : 9시 30분 ~ 종료 시간 : 17시 30분

calendar
커리큘럼
  • 스파크로 구축하는 분산처리 빅데이터 플랫폼

    Module 1 – Hadoop 기초와 빅데이터 플랫폼의 개념 및 설계 이해

    • 빅데이터 플랫폼과 하둡

    • 빅데이터 플랫폼 구축기획 및 설계

    • Hadoop의 기초와 Spark의 개념

     

    Module 2 –Hadoop 데이터 처리와 분석 기반을 위한 Spark Core

    • Spark CORE 이해와 데이터 처리

    • Spark RDD 이해와 데이터 처리 및 분석

     

    Module 3 - 효율적인 데이터 처리와 분석을 위한 Spark SQL

    • Spark의 개념과 아키텍처를 이해

    • Spark 기본적인 사용법과 연동방법

    • Spark API  깊이 파헤치기

     

    Module 4 – 빠른 데이터 분석을 위한 Spark

    • SQL을 사용할 수 있게 해주는 Spark SQL의 이해와 실습 

    • Spark SQL로 멋진 쿼리를 실행하기

    • Spark 애플리케이션 활용하기

     

    Module 5 - 빠른 데이터 분석을 위한 Spark

    • Spark API 활용

    • Spark 스트리밍으로 데이터를 흐르게 하기

    • Spark  ML로 만드는 분류와 군집화

1,600,000원 (면세)

TAGS

2026년 01월

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31