8월, 2014의 게시물 표시

Becoming a Data Scientist

이미지
10개의 Metro Line(Domain)과 약 200 여개의 Station으로 구성된 Data Scientist의 Curriculum Metomap 입니다.   Data Scientist가 되기 위해서는 여기서 제시하는  Station에서 몇 개의 Out-Of-Date 항목은 제외하고 3,4백개의 Station이 필요합니다. 또한 Biz Domain에 대한 지식, 의사 소통 기술, 프로젝트 관리 능력, Presentation 능력 등도 Big Data Expert가 되기 위해서는 필요한 Metro Line 입니다.   1. Fundamentals   2. Statistics   3. Programming   4. Machine Learning   5. Text Mining / Natural Language Processing   6. Data Visualization   7. Big Data   8. Data Ingestion   9. Data Munging 10. Toolbox ref   :  http://nirvacana.com/thoughts/becoming-a-data-scientist/

빅데이터 시대, 어떤 학과목이 중요할까요?

빅데이터 시대, 어떤 학과목이 중요할까요? 어느 분이 이렇게 답을 하네요.  "Big Data는 빅데이터스럽게, 모든 과목"  ^^ 틀리지는 않았지만, 빅데이터의 발전 과정을 역으로 추정해 보면 정답이 보입니다. Big Data 분석을 Data Mining의 발전과정으로 보는 전문가들이 있습니다. 혹자는 Big Data 분석을 "데이터 마이닝 Version 2" 라고 말하기도 합니다.  이러한 데이터 분석과정은 확률과 통계를 기본으로 하죠. 그럼 통계는 어떤가요? 당연히 수학을 기본으로 합니다. 몇몇 Data Scientist와 데이터 분석으로 토의를 하다 보면,  왜 독립변수에 지수역함수인 Log를 취해야 하는지, 라플라스 변환은 왜하는지, 단위행렬과 역행렬의 관계를 이해지 못하고 Matrix 처리를 하는 등  수학적 이해가 부족한 상태에서 분석결과를 제시합니다. 좀 어이가 없죠. 수학은 빅데이터뿐만 아니라 모든 이학 공학 학문에 기초가 되는 중요한 분야입니다.