엄밀히 프로그래머 입장에서 자바스크립트 언어는 객체 지향 언어가 아니라 객체 기반 언어다. 근데 객체 기반 언어는 없는 말이다. 객체 기반 언어는 그냥 만든 말이다. 정확히 말하면 프로토타입(모형, 시제품) 언어라고 볼 수 있다.
객체 지향 언어 : 모든 것을 객체로 관리한다. 재사용성과 유지보수성을 생각해서 만들어야 된다. Java, C++ 등
객체(object) : 클래스의 인스턴스
명사적 특징 : 그 객체가 가지고 있는 데이터(data) ex) 펜의 경우 - 색깔
동사적 특징 : 그 객체로 할 수 있는 행위(behavior) ex) 펜의 경우 - 쓰다
상태는 행위에 영향을 준다.
C
Java
분석/설계
명사적 특징(data)
변수
Field
attribute
동사적 특징(behavior)
함수
Method
operation (behavior)
클래스(class) : 객체를 만들기 위한 틀
객체(object) 와 인스턴스(instance)의 차이 : 객체는 unique하고, 인스턴스는 infinite하다. 예를 들어 책상에 여러 개의 펜이 있을 때 책상 위의 펜들을 인스턴스라고 말하고, 그 중 필기를 위해 한 개를 들었을 때 그것을 객체라고 말한다. (객체는 총칭해서 부르는 말이다.)
* 오라클이 다음에 JDK 업데이트 할 때에는 자바가 자바스크립트를 지원하도록 하겠다고 했다고 한다.
자바스크립트 왜 배울까?
가장 많이 사용되는 곳은 Web. (웹의 내용(html), 표현(css), 동작(javascript))
자바스크립트에서는 Ajax(비동기식 요청)와 DOM제어로 많이 사용한다.
자바스크립트의 특징
형(type)을 지정하는 키워드가 없다. 그래서 a=10, a=3.5, a=func() 모두 사용 가능.
즉, 메모리를 효율적으로 관리할 수는 없다. (개발자의 몫)
ECMAScript
javascript는 ECMAScript 표준을 따르고 있다.
그럼 개발자는 EMCAScript 표준을 따르면 어떤 해석기에서도 해석 가능하다는 뜻이다.
ECMAScript 객체는 속성들의 모음
- 객체들은 0개 이상 속성을 가질 수 있다.
- 속성들은 다른 객체, 원시 값(primitive values), 함수(functions)를 포함할 수 있다.
▷ 변수와 method 구분 없이 모두 속성이라고 얘기한다.
▷ 자바스크립트에서 method라고 부를 때가 있고 함수라고 부를 때가 있다.
그럼 언제 함수라고 부르지?
▶ 자바스크립트에서는 클래스가 없기 때문에 함수를 가지고 객체를 만들 경우.
그럼 언제 method라고 부르지?
▶ 동작을 실행하는 경우.
내장 오브젝트
이 객체들은 모두 함수로 구현되어 있는 생성자라고 생각하면 된다. ECMAScript에서는 JSON도 지원한다.
자바스크립트의 독특한 연산자!! - 타입까지 비교해주는 연산자 ( ===, !== )가 있다.
short circuit - &&, || : 이것들의 결과는 T/F가 아니다. 왼쪽 항 또는 오른쪽 항의 결과가 대입된다. true && true = true(모두 참일 경우 마지막 항이 결과값), false && ? = false(앞이 F면 비교할 필요도없이 결과가 F)
자바스크립트 디버깅 (크롬 기준 설명)
크롬 - [F12]를 누르면 개발자도구가 나옵니다.
거기서 [Console] 탭을 눌러봅니다.
이곳에서 간단한 명령(자바스크립트) 실행가능합니다.
* 깨알 Tip!
간단한 명령 실행을 할 때 주소창에
about:blank
에 들어가서 실행하는 것을 추천합니다!
깨~끗해요
간단한 명령(자바스크립트)를 실행해보겠습니다.
> console.log("Hello")
Hello
>alert("Hello")
>a=10; b=20; c=a+b;
console.log(c);
30
* 참고로 3번째 명령문의 경우 enter가 아닌 shift + enter로 바로 다음줄에 입력가능합니다.
* Tip! 위의 사진을 보시다시피, 어느정도 입력하다보면 희미하게 회색으로 자동완성이 되면서 밑에 입력가능한 명령어들이 나옵니다. 이때 희미한 회색이 본인이 사용하려는 명령어인경우 [Tab]을 누르시면 자동완성이 됩니다.
* Java는 인터프리터 언어이다. 그것을 확인하는 명령.
> console.log("log");
console.error("error"); console.info("info");
console.debug("debug"); console.warn("warning");
console.log("헉! %s가 %d층짜리 건물을 뛰어넘습니다.", animal, count);
타이젠(Tizen)은 휴대 전화를 비롯한 휴대용 장치를 주로 하며, TV, 냉장고와 같은 모든 전자기기에 포함을 목적으로 하는 오픈 소스 모바일 운영 체제이다. 타이젠은 리눅스 파운데이션의 리눅스 커널을 기반으로 하며, HTML5 및 C++ 기반으로 만들어진다. 또한 소프트웨어 개발 키트(SDK)를 통해 응용 프로그램을 개발하기 위해 필요한 각종 도구들과 API를 제공한다.
- Wiki, 위키백과 -
1. 타이젠의 정의
타이젠 SDK는 네이티브 API와 웹앱 API를 모두 제공한다. 따라서 블루투스, NFC(Near Field Communication) 센서처럼 네이티브(Native) 기반 앱에서만 가능한 기능들을 웹앱에서도 지원한다. 또한 W3C 및 HTML5와 같은 다양한 표준을 준수해 플랫폼 독립적인 웹앱을 개발할 수 있고, C++ 기반 네이티브앱으로 개발하면 하드웨어에서 제공하는 최대한의 성능을 이끌어 낼 수 있다.
2. 타이젠 아키텍쳐
<그림 1> 타이젠 아키텍처 (출처 : 타이젠 공식 웹사이트)
타이젠 아키텍쳐는 다음과 같은 subsystem들을 포함하고 있다.
Web framework
타이젠에는 웹애플리케이션을 위한 웹 프레임워크가 있으며 최신 웹 기술을 지원한다. 특히 HTML5 API, 비디오, 오디오, 폼, 2D 캔버스, WebGL, CSS3, 웹소켓, 웹 워커 등과 같이 W3C 및 다양한 표준화 단체에서 정의한 표준이 포함돼 있다. 그리고 표준에서 제공하지 못하는 부족한 부분을 채우고자 블루투스, NFC, 알람, 메시징 등의 다양한 디바이스 API를 제공한다. 이와 함께 웹애플리케이션 실행, 라이프 사키르 관리, 접근 제어 등의 역할을 하는 웹 런타임(Web Runtime)도 제공한다.
Native framework
네이티브 프레임워크는 1만여개가 넘는 API를 제공하며 Base, 입출력, 앱, 보안, 그래픽, UI, 네트워크, 메시징, 소셜, 위치기반, 웹 등 네이티브 애플리케이션이 필요로 하는 다양한 기능을 지원한다.
Core
코어 프레임워크는 웹 프레임 워크 및 네이티브 프레임워크가 공통으로 필요로 하는 기본적인 기능을 제공한다.
Kernel
타이젠 아키텍처의 가장 하위 단인 리눅스 커널과 디바이스 드라이버로 구성돼 있다.
3. 타이젠의 특징
개방형
타이젠의 가장 중요한 특징 중 하나는 오픈소스라는 것이다. 타이젠은 다양한 오픈소스 및 직접 개발된 코드로 이뤄져 있을뿐 아니라 타이젠 자체에 대한 소스 코드가 모두 공개돼 있다.
다양한 종류의 애플리케이션 지원
타이젠은 HTML5, 자바스크립트, CSS3에 기반을 둔 웹애플리케이션뿐만 아니라 C++ 기반 네이티브 애플리케이션 그리고 이 둘을 융합시킨 하이브리드 애플리케이션까지 모두 지원한다.
높은 HTML5 호환성
타이젠은 HTML5와 CSS5 등 W3C 표준 웹 기술을 적극 지원하고 있다.
디바이스 API 지원
타이젠은 다양한 디바이스 API를 지원하여 애플리케이션 개발 과정에서 발생하는 불편함을 최소화하고 있다. 대표적인 디바이스 API로는 블루투스, PIM(Personal Infromation Management), NFC, 알람, 메시징, 전원 제어 등이 있다.
WebGL
안드로이드 앱 호환
인프라웨어테크놀로지는 안드로이드 앱을 타이젠 플랫폼 앱으로 변환하는PAG(Polaris App Generator) 프로그램을 개발했다. 안드로이드 SDK로 개발한 APK 파일을 타이젠 마켓에 등록하기만 하면 자동으로 타이젠 앱으로 변환되고, 사용자는 타이젠으로 별도의 변경과정을 거칠 필요 없이 마켓에서 다운로드해 사용할 수 있다.
아나키 3D 엔진 : 모바일 3D 게임 엔진
코코스2d-x 엔진
크로스 카테고리
<그림 2> 타이젠의 크로스 카테고리 전략 (출처 : 2012 리눅스 코리아 포럼 타이젠 소개 자료)
크로스 아키텍처
타이젠은 x86과 ARM 아키텍처를 모두 지원하는데, 타이젠 에뮬레이터는 x86을, 테스트용 디바이스는 ARM을 각각 지원한다.
라이선스
다양한 오픈소스를 사용하는 만큼 타이젠은 복잡한 라이선스 정책의 영향을 받는다. 각 모둘에 따라서 GPLv2, LGPL, Apache, BSD, Flora 라이선스 등을 따르며, SDK의 경우에는 타이젠 SDK 라이선스라는 별도의 라이선스 정책을 준수해야 한다.
보안
타이젠은 리눅스 커널 단에서 지원하는 Smack(Simplified Mandatory Access Control Kernel)을 적용해 인가되지 않은 데이터나 프로세스 접근을 막아 보안을 강화했다.
HDFS와 MapReduce에서 공통으로 사용하는 로그 파일, 네트워크 튜닝, I/O 튜닝, 파일 시스템 튜닝, 압축 등과 같은 하둡 코어를 위한 환경 설정 파일이다. MapReduce에서도 공통으로 사용한다. fs.default.name 에 hdmaster는 namenode 호스트 이름을 적는다. hadoop.tmp.dir는 자신의 설정에 따라 경로를 적도록 한다.
~/hadoop/etc/hadoop$ vim core-site.xml
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://hdmaster:9000</value>
<final>true</final>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>${HADOOP_PREFIX}/hdfs/tmp</value>
</property>
</configuration>
4.4.4. hdfs-site.xml
이 파일은 네임노드, 보조 네임노드, 데이터 노드 등과 같은 HDFS 데몬을 위한 환경을 구성한다. dfs.namenode.name.dir은 파일의 디렉토리 정보와 파일 정보 등을 저장하는 폴더이다. 해당 저장위치는 hdfs가 아닌 로컬에 저장을 한다. dfs.datanode.name.dir은 하둡 파일 시스템에 저장되는 모든 파일이 저장되는 위치이다. dfs.replications의 경우 얼마나 많은 노드에 동일한 자료를 복제하여 저장할 것인지 설정하는 것으로 전체 데이터 노드의 개수보다 작아야 한다.
맵리듀스(MapReduce)는구글에서 대용량 데이터 처리를 분산 병렬 컴퓨팅에서 처리하기 위한 목적으로 제작하여 2004년 발표한 소프트웨어 프레임워크다.이 프레임워크는 페타바이트 이상의 대용량 데이터를 신뢰도가 낮은 컴퓨터로 구성된 클러스터 환경에서 병렬 처리를 지원하기 위해서 개발되었다. 이 프레임워크는 함수형 프로그래밍에서 일반적으로 사용되는 Map과 Reduce라는 함수 기반으로 주로 구성된다.
현재 MapReduce는 Java와 C++, 그리고 기타 언어에서 적용이 가능하도록 작성되었다. 대표적으로 아파치 하둡에서 오픈 소스 소프트웨어로 적용된다.
- WIKI, 위키백과 -
맵리듀스는 배치 기반의 분산 컴퓨팅 프레임워크다.
맵리듀스 모델은 연산 병렬화, 작업 분산, 비안정적 하드웨어 및 소프트웨어를 다루는 복잡성 같은 요소를 추상화함으로써 병렬 처리를 단순화해준다.
맵리듀스는 클라이언트에서 전송한 잡을 병렬화된 작은 맵과 리듀스 작업자로 분배한다.
프로그래머가 할 일은 맵과 리듀스 함수를 정의하는 것이다.
맵 함수는 키/값 튜플(tuple)을 출력
출력된 튜플은 리듀스 함수에 의해 처리돼 최종 결과를 도출
맵 : (key1, value1) → list(key2, value2) ① ② ① : 맵 함수는 입력 데이터 소스의 논리적 레코드를 나타내는 키/값 쌍을 입력값으로 받는다. 파일의 경우 이 값은 한 줄이 될 수 있고, 입력 소스가 DB의 테이블인 경우 한 행이 될 수 있다. ② : 맵 함수는 한 개의 입력값 쌍에 대해 0개 이상의 출력 키/값 쌍을 내보낸다. 예를 들어 맵 함수가 필터링 맵 함수이면 특정 조건이 리듀스 함수에서는 충족될 때만 결과를 출력할 수 있다. 또는 한개의 입력 키/값이 여러 개의 키/값 출력 쌍을 반환하는 역다중화 작업을 수행할 수도 있다.
리듀스 : (key2, list(value2)) → list(key3, value3) ① ② ③ ① : 리듀스 함수는 고유 맵 출력. 키별로 한 번씩 ② : 'key2'에 대해 모든 매퍼에서 내보낸 맵. 출력값이 한 개의 목록으로 제공된다. ③ : 맵 함수와 마찬가지로 리듀스 함수도 0개 이상의 키/값 쌍을 출력할 수 있다. 리듀서 출력값은 HDFS 내 플랫 파일에 쓰거나, NoSQL DB에서 행을 삽입/업데이트하거나, 다른 요구 조건에 따라 임의의 데이터 싱크에 쓸 수 있다.
Shuffling : 셔플 및 정렬 단계에서는 두 개의 주요 작업을 처리한다. 맵 출력 키/값 쌍을 수신할 리듀서를 판단하는 작업(파티셔닝이라고 부름)과 해당 리듀서에 대해 모든 입력 키가 정렬되게끔 하는 기능.
각 화살표 별로 설명을 하자면!!
입력 데이터 분리 : 맵리듀스는 입력 파일을 키와 값 형식의 데이터로 분류한다. 이 예제에서 키는 라인 번호이고 값은 문장이다.
맵 메서드1 : 키와 값 형식의 데이터는 맵 메서드의 입력 데이터로 전달된다.
맵 메서드2 : 맵 메서드는 라인 번호별로 문장을 체크해 키에 해당하는 글자별로 글자 수를 출력한다.
정렬과 병합 : 맵리듀스는 맵 메서드의 출력 데이터를 정렬하고, 병합한다.
리듀스 메서드 : 4번의 결과가 리듀스 메서드의 입력 데이터로 전달된다.
저장 : 리듀스 메서드는 새로운 키인 글자별로 각 글자 수를 합산해서 출력하고, 리듀스 메서드의 출력 데이터를 하둡 파일 시스템에 저장한다.
[ 맵리듀스 시스템 ]
클라이언트 사용자가 실행한 맵리듀스 프로그램과 하둡에서 제공하는 맵리듀스 API를 의미한다. 사용자는 맵리듀스 API로 맵리듀스 프로그램을 개발하고, 개발한 프로그램을 하둡에서 실행할 수 있다.
잡트래커(JobTracker) 클라이언트가 하둡으로 실행을 요청하는 맵리듀스 프로그램은 잡(job)이라는 하나의 작업 단위로 관리된다. 잡트래커는하둡 클러스터에 등록된 전체 잡의 스케줄링을 관리하고 모니터링한다. 전체 하둡 클러스터에서 하나의 잡트래커가 실행되며, 보통 하둡의 네임노드 서버에서 실행된다.(반드시 네임노드 서버에서 실행할 필요는 없음) 사용자가 새로운 잡을 요청하면 잡트래커는 잡을 처리하기 위해 몇 개의 맵과 리듀스를 실행할지 계산한다. 이렇게 계산된 맵과 리듀스를 어떤 태스크트래커에서 실행할지 결정하고, 해당 태스크트래커에 잡을 할당한다. 이 때 태스크트래커는 잡트래커의 작업 수행 요청을 받아 맵리듀스 프로그램을 실행한다. 잡트래커와 태스크트래커는 하트비트라는 메서드로 네트워크 통신을 하면서 태스크트래커의 상태와 작업 실행 ㅈ어보를 주고받게 된다. 만약 태스크트래커에 장애가 ㅂ라생하면 잡트래커는 다른 대기 중인 태스크트래커를 찾아 태스크를 재실행하게 된다.
태스크트래커(TaskTracker) 사용자가 설정한 맵리듀스 프로그램을 실행하며, 하둡의 데이터노드에서 실행되는 데몬이다. 태스크트래커는 잡트래커의 작업을 요청받고, 잡트래커가 요청한 맵과 리듀스 개수만큼 맵 태스크(map task)와 리듀스 태스크(reduce task)를 생성한다.
하둡에 대해서 알기 전에 역사를 아는 것도 매우 재미있습니다. 시간이 되시는 분들은 찾아보시길..
"아파치 하둡(Apache Hadoop, High-Availability Distributed Object-Oriented Platform)" 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 프리웨어 자바 소프트웨어 프레임워크이다. 원래 너치의 분산 처리를 지원하기 위해 개발된 것으로, 아파치 루씬의 하부 프로젝트이다. 분산처리 시스템인 구글 파일 시스템을 대체할 수 있는 하둡 분산 파일 시스템(HDFS: Hadoop Distributed File System)과 맵리듀스를 구현한 것이다.
- WIKI, 위키백과 -/
하둡은 분산 저장소와 연산 기능을 모두 제공하는 플랫폼
하둡은 오픈소스 프로젝트 (∴라이선스 비용에 대한 부담 x)
아파치 하둡 프로젝트의 특징
안정적이고, 신뢰할 수 있다(reliable)
확장이 용이(scalable)
분산 컴퓨팅(distributed computing) 환경 지원
[ 하둡 분산 파일 시스템 (HDFS; Hadoop Distributed File System) ]
하둡은 저장을 위한 하둡 분산 파일 시스템(HDFS; Hadoop Distributed File System)으로 구성된마스터-슬레이브 아키텍처와 연산을 위한 맵리듀스로 이뤄진다.
마스터 : 슬레이브 노드에서 실행 예약할 연산 작업을 관리하는 책임을 담당
HDFS 마스터 : 슬레이브 노드 사이의 저장 공간 파티셔닝과 데이터 저장 위치를 관리하는 책임을 담당
하둡의 저장 공간과 연산 능력은 하둡 클러스터에 호스트를 추가함에 따라 늘어나고, 수천 개의 호스트를 클러스터에 추가해 페타바이트 크기의 데이터까지 처리 할 수 있다.
HDFS는 하둡의 저장소 컴포넌트이다.
큰 블록 크기 밍 데이터 로컬리티(data locality)를 통한 최적화를 활용해 네트워크 입/출력을 줄인다.
확장성과 가용성 또한 HDFS의 핵심 특징이다.
HDFS는 설정된 횟수만큼 파일을 복제하고, 소프트웨어 및 하드웨어의 장애를 견뎌낼 수 있으며, 장애가 생긴 노드에서는 데이터 블록을 자동으로 재복제한다.
마스터노드는 데이터 노드를 갖지 않고, JobTracker를 갖는다.
슬레이브 노드 중 하나는 Secondary NameNode를 갖고, 슬레이브 노드들은 TaskTracker를 갖는다.
빅 데이터란 기존 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석 할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술을 의미한다.
- WIKI (http://ko.wikipedia.org/wiki/빅_데이터)
빅 데이터의 3대 요소(3V)
크기(Volume) 급격하게 데이터의 양이 증가하고 있는데, 이때문에 확장 가능한 방식으로 데이터를 저장하고 분석하는 분산 컴퓨팅 기법으로 접근해야 한다.
속도(Velocity) - 실시간 처리 : 오늘날 디지털 데이터는 매우 빠른속도로 생성되기 때문에 데이터의 생산, 저장,유통, 수집, 분석이 실시간으로 처리돼야 한다. - 장기적인 접근 : 수집된 대량의 데이터를 다양한 분석 기법(ex. 데이터 마이닝, 기계학습, 자연어 처리, 패턴 인식)과 표현 기술로 분석
다양성(Variety) - 정형(Structured) 데이터 : 정형화된 데이터로, 고정된 필드에 저장되있는 일정한 형식을 갖추고 저장되는 데이터 온라인 주문할 때 이름, 주소 등을 입력한 후 주문을 하면 DB에 미리 생성돼 있는 테이블(고정된 필드)에 저장된다. - 반정형(Semi-Structured) : 고정된 필드로 저장돼 있지는 않지만, XML이나 HTML 같이 메타데이터나 스키마 등을 포함하는 데이터 - 비정형(Unstructed) : 고정된 필드에 저장돼 잇지 않은 데이터 ex. 블로그에서 저장하는 사진, 메신저로 주고받은 대화 내용 등