데이터 기술의 흐름

맞춤형 서비스부터 딥러닝까지

May 24, 2025

쿠팡의 추천 상품, 날씨 앱의 예보, 병원 예약 시스템까지 —

우리 일상 속 ‘예측’은 이제 너무 자연스럽다.

이 모든 기술의 공통점은 바로 데이터와 그 분석에 있다.

이번 글에서는 이러한 기술들이 어떻게 현실 속 서비스로 이어지는지를
정리해보려 한다.


복지몰과 DX의 만남

기업, 공공기관, 군대에는 모두 복지몰이라는 것이 존재한다.
군인의 PX, 공무원의 복지 포인트, 대기업 직원들의 기념일 선물 등은
이제 전부 디지털화되어 복지몰에서 처리된다.

이제는 자체적으로 복지몰을 새로 만들지 않아도 된다.
DX(디지털 전환) 관점에서, 복지몰 플랫폼을 서비스 형태로 구독하게 된 것이다.

사용자 페르소나 1: 기업 임직원 (복지몰 사용자)
사용자 페르소나 2: 복지몰 관리자 (운영자)

각 사용자의 라이프 사이클(결혼, 육아, 퇴직 등)에 맞춘 콘텐츠 큐레이션이 핵심이다.


데이터 기술의 흐름

데이터 분석은 다양한 기술의 융합으로 이루어진다.
그 흐름을 이해하기 위해 전체 구조를 시각화한 도식에서 주요 영역을 살펴보자.

데이터 분석 영역 요약

구분 설명
통계 수학 기반. 기존 데이터 분석 기법
머신러닝 컴퓨터가 데이터에서 규칙을 학습
AI 컴퓨터 공학 영역의 자동화된 판단 시스템
데이터 사이언스 통계 + 컴퓨터 공학 + 도메인 지식을 융합한 분야

데이터 분석의 중심, 도메인 지식

통계와 머신러닝 모두 데이터를 분석하는 데 사용되지만,
도메인에 대한 깊은 이해가 있을 때 의미 있는 인사이트를 도출할 수 있다.

이를 데이터 마이닝이라 하며, 데이터 사이언스의 핵심 역량이다.


빅데이터 활용 사례: 현대자동차

현대차는 검색어 데이터와 판매량 데이터 간 상관관계를 분석해 예측 정확도를 높였다.

  1. 기존 판매량 예측 → 정확도 낮음
  2. 검색량 데이터 연동 → 생산/물류 사전 대응 가능

상관관계: 두 데이터가 비슷한 추이를 보이면 예측 지표로 활용 가능


데이터 분석 프로세스

분석의 전체 흐름은 다음과 같다.

  1. 기획 및 목적 설정
  2. 데이터 수집
  3. 전처리
  4. 저장 및 보존
  5. 분석 및 모델링
  6. 시각화
  7. 서비스 및 의사결정 활용

데이터 형태에 따른 분석 방법론

분석 유형 설명
매트릭스 분석 정형 데이터 간 관계 비교
수치 분석 통계적 기법 + 예측 모델링 (머신러닝)
이미지 분석 객체 인식, 얼굴 인식, 의료 영상 분석 등
텍스트 분석 감성 분석, 토픽 모델링, 개체명 인식 등

인공지능 시스템의 구조

AI 시스템은 기본적으로 다음 구조를 갖는다.

입력 ➡️ 분석 ➡️ 결과 출력

이때 입력은 웹에서 우리가 만든 <input>이나 검색창 등이 될 수 있다.

  1. 규칙 기반 전문가 시스템: 사람이 만든 규칙을 사용
  2. 머신러닝 시스템: 데이터를 통해 기계가 규칙을 스스로 학습

머신러닝과 딥러닝

구분 설명
머신러닝 기계가 데이터를 기반으로 규칙 학습
딥러닝 머신러닝 중 하나로, 반복 학습을 통해 심화된 모델 생성
예시 매일 사용하는 ChatGPT도 딥러닝 기술의 산물

머신러닝은 크게 두 가지 학습 방식으로 구분된다.

  • 지도 학습: 사람이 라벨을 제공
  • 비지도 학습: 기계가 스스로 규칙을 탐색

실무에서는 신뢰도 문제로 지도 학습이 더 많이 사용된다.


오늘을 마치며

데이터 사이언스는 단순히 데이터를 다루는 기술이 아니다.
통계적 사고, 컴퓨팅 역량, 도메인 이해가 모두 어우러져야 한다.

앞으로의 프로젝트에서는 아래 주제를 고려해보자!

예측 분석 (수치 중심)
이미지 인식 (비정형 데이터)
텍스트 분석 (뉴스, SNS 등)
대시보드 및 시각화 (BI)