교육 개요

이 과정에서는 웹상에 존재하는 데이터를 수집하기 위한 방법을 학습니다. HTTP프로토콜에 대한 이해를 바탕으로 html문서를 파싱하는 beautifulsoup, 웹페이지 추출을 위한 requests, 엑셀 파일 파싱하는 openpyxl, json, cvs, xml 데이터를 다루는 방법을 학습합 니다.

교육 대상
  • 파이썬으로 웹상의 데이터를 추출하고자 개발자
  • 엑셀, csv, json, xml 데이터를 처리하고자 하는 개발자
교육 효과
  • HTTP 프로토콜 이해
  • 웹 문서 파싱
  • 엑셀 데이터 읽고 쓰기
  • csv, json, xml 데이터 처리
실습 환경

Python3

교육 내용
구분 목차 주요 내용
    1일차
  • HTTP
  • HTTP 프로토콜
  • HTML/CSS 요약
  • Httplib, requests 사용법
    2일차
  • 웹 페이지 처리
  • BeautifuSoup을 이용한 웹페이지 파싱
  • 날씨정보 파싱
  • 신문기사 RSS 리더 만들기
    3일차
  • 주요 데이터 형식 처리
  • CSV 처리
  • JSON 처리
  • XML 처리
  • 도서검색 결과 처리