IT
빅데이터
잠재우기
2017. 12. 23. 00:00
옛날자료 보관용
빅데이터 - 보통은 2가지 교육 커리큘럼
1. 하둡
2. 분석기술 - 이게 중요하지만 이부분에 대해 강의가 가능한 분이 거의 없다.
빅데이터의 개요
4V
1. 빅데이터는 대용량이다(볼륨 Volume) 테라~페타바이트
2. 데이터 발생/처리 속도도 빠르다.
3. 다양성, 데이터 성장은 갈수록 비정형화된 구조
4. 가치(Value)
HDFS
- Master : NameNode
- Slave : DataNode
MapReduce
- Master : JobTracker
- Slave : TaskTracker