CloudOps Chronicles

ADSP 데이터의 이해 요약(1과목) 본문

etc..

ADSP 데이터의 이해 요약(1과목)

쿠르미 2023. 9. 26. 15:24

1-1 데이터와 정보 

 

데이터의 유형

  • 정성적 데이터 : 저장, 검색, 분석에 많은 비용이 소모 되는 언어, 문자 형태의 데이터 (ex : 회사 매출이 증가함)
  • 정량적 데이터 : 정형화된 데이터로 수치, 도형, 기호 등의 형태를 가진 데이터 (ex: 나이, 몸무게, 주가)

 

지식경영의 핵심 이슈

구분 의미 특징 상호작용
암묵지 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드러나지 않는 지식(ex: 김장김치 담그기, 자전거 타기) 사회적으로 중요하지만 공유되기 어려움  공론화, 내면화
형식지 문서나 매뉴얼처럼 형상화된 지식(ex: 교과서, 비디오, DB) 전달과 공유가 용이함 표출화, 연결화

 

 

DIKW 피라미드

  1. 지혜 wisdom 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어
  2. 지식 Knowledge 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물
  3. 정보 information 데이터의 가공 밒 상관관계간 이해를 통해 패턴을 일식하고 그 의미를 부여한 데이터 
  4. 데이터 Data 존재형식을 불문하고, 타 데이터의 상관관계가 없는 가공하기 전의 순수한 수치나 기호 

 


1-2  데이터 베이스 정의와 특징

 

 데이터베이스의 정의

EU 체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물
국내 저작권법 소재를 체계적으로 배열 또는 구성한 편집물로 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것

국내 컴퓨터 용어사전 동시의 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고 저장, 공급하지 위하여 일정한 구조에 따라서 편성된 데이터의 집합

 

데이터베이스 특징

통합된 데이터 (Integrated Data) 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미 
데이터 중복은 관리상의 복잡한 부작용을 초래 
저장된 데이터 (Stored Data) 자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미 
데이터베이스는 시본적으로 컴퓨터 기술을 바탕으로 한 것
공용 데이터 (Shared Data) 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이요한다는 것을 의미 
대용량화되고 구조가 복잡한 것이 보통
변화되는 데이터( Changeable Data) 데이터베이스에 저장된 내용은 곧 데이터베이스의 현 시점에서의 상태를 나타냄
다만 이 상태는 새로운 데이터의 삽입, 기존 데이터의 삭제, 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지해야 함

2-1 빅데이터의 이해 

 

빅데이터의 정의 

 

1. 관점에 따른 정의 

Mckinsey(2011) IDC(2011)  가트너 그룹(Gartner Group)
더그 레니 (Doug Laney)의 3V
일반적인 데이터 베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터  다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 수출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍쳐  Volume :데이터 규모 측면
Variety : 데이터의 유형과 소스 측면
Velocity : 데이터의 수집과 처리 측면
데이터 규모에 중점을 둔 정의  분석 비용 및 기술에 초점을 둔 정의

 

2. 빅데이터 정의의 범주 및 효과

데이터 변화
규모 ( Volume)
형태 ( Variety)
속도 ( Velocity)

 

기술 변화
데이터 처리, 저장, 분석기술 및 아키텍쳐 
클라우드 컴퓨팅 활용

 

인재, 조직 변화
 Data Scientist같은 새로운 인재 필요 
데이터 중심 조직

 

 

2. 출현 배경과 변화

  • 산업계 : 고객 데이터 축척, 보유를 통해 데이터에 숨어있는 가치를 발굴
  • 학계 : 거대 데이터를 다루는 학문 분야가 늘어나면서 필요한 기술 아키텍쳐 및 통계 도구의 발전
  • 기술발전 : 관련기술(저장, 인터넷 보급, 클라우드 컴퓨팅, 모바일 혁명)의 발달

 

 

3. 빅데이터가 만들어 내는 본질적인 변화 

  • 사전처리 -> 사후처리 
  • 표본조사 -> 전수조사
  • 질 -> 양
  • 인과관계 -> 상관관계 

 

 

2-2 빅데이터의 가치와 영향

  • 빅데이터의 가치 산정이 어려운 이유 
  • 데이터 활용방식
  • 새로운 가치 창출
  • 분석기술 발전

 

Comments