Category: Spark

Spark 아파치 스파크 (1) 소개

아파치 스파크(Apache Spark) 스터디를 위해 정리한 자료입니다. 하둡 Hadoop 빅 데이터 처리나 데이터 분석 쪽에는 지식이 없어 하둡부터 간단하게 알아봤습니다. 동작 원리 하둡 프레임워크는 파일 시스템인 HDFS(Hadoop Distributed File System)과 데이터를 처리하는 맵리듀스(MapReduce) 엔진을 합친 것으로 대규모