교육 개요

기하급수적인 정보량의 증가로 인해 빅데이터를 처리하는 기술들이 발전하는 가운데, 쌓여진 빅데이터를 어떻게 처리 활용하고 그 안에서 가치를 찾아낼 수 있을 것인가에 고민하는 분들을 위한 과정입니다. 빅데이터를 활용한 어플리케이션을 개발할 수 있으며 빅데이터의 수집, 저장, 가공, 분석을 위한 빅데이터 프레임웍을 학습하여 실무에 활용할 수 있습니다.

교육 대상
  • 빅데이터 프레임웍에 관심있는 개발자
  • 빅데이터 프레임웍을 활용해 어플리케이션을 개발해야하는 개발
교육 효과
  • 빅데이터 프레임웍에 대한 이해도를 높이고 프레임웍을 활용한 어플리케이션 개발이 가능
  • 빅데이터 프레임웍 구축 및 빅데이터 활용도를 높일수 있음
  • 저렴한 비용의 데이터 처리 방법을 오픈소스를 활용하여 구성할수 있음
실습 환경

Linux centos 6.5 + Hadoop 2.6

교육 내용
구분 목차 주요 내용
    1일차
  • 빅데이터 소개 및 Overview
  • 하둡의 소개
  • 빅데이터 시장동향
  • 하둡의 개요
  • 하둡과 에코시스템 개요
  • HDFS 소개
  • 하둡 시스템 구축
    2일차
  • 병렬처리 프레임웍의 소개
  • MapReduce
  • MapReduce 를 활용한 병렬처리
  • MapReduce 구현
  • WordCount 예제 및 다양한 예제
    3일차
  • Hadoop EcoSystem
  • Pig Latin 소개 및 설치
  • Apache Hive 소개 및 설치
  • Ecosystem을 활용한 어플리케이션작성
    4일차
  • ·Hadoop EcoSystem
  • 데이터 수집을 위한 Flume 소개 및 설치
  • 데이터 Integration 을 위한 Sqoop 소개 및 설치
    5일차
  • Machine Learning 의 개요
  • Apache Mahout 소개 및 설치
  • Machine Learning 을 활용한 어플리케이션 개발
  • 마홋을 활용한 추천 시스템 개발