하둡 업무 영역과 Architecture

하둡의 업무 영역과 각 구성요소의 Architecture를 그려 보았습니다. 전체 관점에서 하둡을 이해하는데 도움이 됩니다.   Hadoop 업무 영역   HDFS Architecture   MapReduce Architecture   YARN Architecture    

빅데이터 개요

빅데이터의 정의 기존 데이터에 비해 너무 방대해 일반적으로 사용하는 방법이나 도구로 수집, 저장, 처리, 분석, 시각화 등을 하기 어려운 정형 또는 비정형 데이터의 집합 초점 정의 데이터 규모 (맥킨지, 2011.5) 기존 데이터베이스 관리 도구의 데이터 수집, 저장, 관리, 분석하는 역량을 넘어서는 데이터 업무 수행 방식 (IDC, 2011.6) 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고, […]

하둡에서 한글 사용 설정

문자셋과 인코딩 문자셋 (charset, Character Set) 하나의 언어권에서 사용하는 언어를 표현하기 위한 모든 문자(활자)의 모임을 문자셋이라고 합니다. 다시 말하면 우리가 얘기하는 언어를 책으로 출판할 때 필요한 문자(활자)를 모두 모은 것이라고 보면 됩니다. 그러므로 부호와 공백 등과 같은 특수 문자도 문자셋에 포함 됩니다. 영어의 경우 알파벳 대소문자와 특수 문자 등으로 간단하게 문자셋을 구성할 수 있지만 한글의 […]