10대를 위한 데이터과학 with 엔트리 - 일상의 문제를 데이터로 해결해보자! 구구박사님의 10대를 위한 시리즈 1
구덕회 외 지음 / 잇플ITPLE / 2022년 10월
평점 :
장바구니담기


빅데이터는 'V' 로 시작하는 5가지 특징을 가지고 있어요. 양(Volume),속도(Velocity),다양성(Veracity),가치 (Value)로 5개의 V 라고 하여 5V 라고도 해요. 그럼 이 다섯 가지 특징을 더 자세히 살펴보도록 해요.

첫 번째는 방대한 데이터의 양(Volume) 이에요. 정보통신기술의 발전으로 대량의 데이터를 이전보다 쉽게 수집할 수 있게 되었어요. 따라서 활용할 수 있는 데이터의 양이 많아지면서 데이터의 활용범위도 함께 넓어졌어요.

두 번째는 새로운 데이터가 만들어지는 속도(Velocity)예요. 우리가 스마트폰과 인터넷으로 소셜 미디어를 사용하거나 검색하는 과정에서 데이터는 계속 만들어져요. 이처럼 데이터는 다양한 곳에서 빠르게 생산되고 있어요.

세 번째는 데이터의 형태가 다양(Variety)해요. 데이터의 형태는 숫자뿐만 아니라 이미지,음성 등 다양한 형태가 있어요.

네 번째로 데이터는 타당성(Veracity)을 가져야 해요. 많은 양의 데이터에는 정확하지 않거나 분석에 오류를 발생시킬 수 있는 데이터도 있어요. 이러한 데이터들은 데이터 분석의 정확도를 떨어뜨릴 수 있어요.

다섯번째는 데이터로 가치를 끌어내는 것(Value)이에요. 데이터 분석을 토대로 의사결정을 내리거나 미래를 예측하는 등의 가치를 끌어낼 수 있어요.(-19-)

2020년 1월 9일 데이터 3법이 국회 본회의를 통과하였고, 2020년 8월 5일 데이터 3법이 본격적으로 시행에 들어가게 된다. 그로 인해 국가나 개인이 만들어낸 , 공공데이터를 합법적으로 사용할 수 있는 법적 근거를 확보하였으며, 산업 전반에 빅데이터 활용 가능성을 키워나갈 수 있었다. 그동안 시행규칙에 따르자면, 법이 허용하는 범위 내에서, 빅데이터가 제4차산업혁명을 주도할 것이라는 생각이 미치게 되었고,우리는 새로운 과학적 이해와 가치를 만들었다. 빅데이터를 활용하여, 인간의 소비패턴, 행동 패턴, 이동 패턴을 실시간으로 확인할 수 있었으며 알파고를 통해 고객의 삶과 소비를 편리하게 해준다.

과정에, 10대 청소년에게 필요한 것은 빅데이터를 활용한 IT 소양이다.청소년이 베우는 교과 과정에 꼭 필요하다., 이것은 그동안 우리가 추구해왔던 데이터 활용을 넘어서서, 새로운 가치를 만들어내는 기준이 되고 있으며, 소셜미디어의 활용이 커진다.빅 데이터의 양과 속도, 다양성, 타당성, 가치를 검증하고, 그것을 어떻게 인공지능이 인식할 수 있는 요령 , 엔트리의 구조를 이해하기 위해서, 알고리즘과 딥마인드에 대한 이해,분석, 실제로 엔트리를 이해함으로서, 알고리즘을 이해할 수 있다. 변수와 상수, 함수와 데이터 과학과 데이터 수학을 동시에 검증해 나가는 것이나 마찬가지다. 이 책은 실제 공공데이터를 각 통계사이트에서 구하고, 그 데이터를 어떻게 정규화하는지, 정규화된 데이터를 어떻게 활용할 수 있는지 전 과정을 이해하고, 분석하고, 분류하면서,미래를 예측할 수 있는 기준을 만들 고자 한다.


댓글(0) 먼댓글(0) 좋아요(4)
좋아요
북마크하기찜하기 thankstoThanksTo