Big Data의 소개 |
|
"BigData"
빅 데이터란 기존 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석 할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다.
- WIKI (http://ko.wikipedia.org/wiki/빅_데이터)
빅 데이터의 3대 요소(3V)
크기(Volume)
급격하게 데이터의 양이 증가하고 있는데, 이때문에 확장 가능한 방식으로 데이터를 저장하고 분석하는 분산 컴퓨팅 기법으로 접근해야 한다.속도(Velocity)
- 실시간 처리 : 오늘날 디지털 데이터는 매우 빠른속도로 생성되기 때문에 데이터의 생산, 저장,유통, 수집, 분석이 실시간으로 처리돼야 한다.
- 장기적인 접근 : 수집된 대량의 데이터를 다양한 분석 기법(ex. 데이터 마이닝, 기계학습, 자연어 처리, 패턴 인식)과 표현 기술로 분석다양성(Variety)
- 정형(Structured) 데이터 : 정형화된 데이터로, 고정된 필드에 저장되있는 일정한 형식을 갖추고 저장되는 데이터
온라인 주문할 때 이름, 주소 등을 입력한 후 주문을 하면 DB에 미리 생성돼 있는 테이블(고정된 필드)에 저장된다.
- 반정형(Semi-Structured) : 고정된 필드로 저장돼 있지는 않지만, XML이나 HTML 같이 메타데이터나 스키마 등을 포함하는 데이터
- 비정형(Unstructed) : 고정된 필드에 저장돼 잇지 않은 데이터
ex. 블로그에서 저장하는 사진, 메신저로 주고받은 대화 내용 등
'IT > Big Data' 카테고리의 다른 글
02. Hadoop 2.2.0 install on Ubuntu Linux 12.04 (0) | 2014.05.13 |
---|---|
01. Introduction to Big Data (3) - MapReduce? (0) | 2014.04.23 |
01. Introduction to Big Data (2) - Hadoop? (0) | 2014.04.20 |
[빅데이터] 스터디 일정 (0) | 2014.03.09 |