스터디, 팀, 학회/우먼 잇츠 3기 [딥러닝]

chap 1 : 왜 현재 AI가 가장 핫할까?

gureumsocute 2025. 2. 28. 15:02

1.1 AI vs ML vs DL

AI > ML > DL 순으로 범위가 좁아짐

AI는 인간의 지능을 인공적으로 구현한 기술 전체를 말함

ML은 인간의 학습 능력을 컴퓨터에서 실행시키려는 기술을 말함 규칙 기반과 데이터 기반으로 나뉨

DL은 사람처럼 스스로 생각하고 말하는 것에 초점을 맞춘 기술을 말함

 

1.2 규칙 기반(Rule-based) vs 데이터 기반(Data-based)

규칙 기반 데이터 기반

정의 사람이 직접 수행 방법을 지정 AI 스스로 규칙을 찾음
사진이나 데이터를 계속 제공함    
사람의 역할 모든 개별 로직을 입력 학습할 수 있는 알고리즘을 개발
주체 개발하는 사람 내장 학습된 데이터
     

 

 

1.3  AI는 어떻게 이미지를 분류할까?

  1. 각 데이터에 해당하는 분류 정보를 숫자로 대응시키기

[레이블을 만듦. 예) 강아지 사진==1, 고양이 사진==0]

  1. AI 모델에 수많은 강아지와 고양이 사진을 반복적으로 입력, 각각에 해당하는 숫자를 출력하도록 학습
  2. 충분한 학습 후, 모델에 테스트 사진을 입력하면 0과 1 사이의 값을 출력

(출력값이 0.9라면 해당 사진을 90% 확률로 강아지라고 판단한 것으로 해석)

** 모든 정보는 숫자로 처리함 == 출력과 입력 모두 숫자로 이루어져야 함

 

 

이미지는 ‘행렬’

💡 행렬이란? 가로와 세로로 숫자들이 나열된 구조

💡 픽셀이란? 이미지의 각 칸 픽셀은 보통 0~255 사이의 정수이며 해당 위치의 밝기를 표현함 숫자가 크면 밝고, 행과 열의 개수가 많을수록 이미지를 더 세밀하게 표현함

💡 컬러 이미지? 3차원 행렬로 표현 RGB에 대해 각각 0~255의 값을 가지는 행렬을 사용 == RGB 채널 하나의 이미지가 세 개의 채널을 가짐

💡 해상도? 이미지의 정밀도를 나타내는 지표 주로 가로와 세로의 픽셀 수로 표현

📌 딥러닝 프레임워크에서는 채널, 행, 열 순으로 이미지 크기를 표시함 예) 3100100은 100*100 픽셀을 가지는 컬러 이미지를 의미

 

 

1.4  AI는 어떻게 번역을 할까?

💡 자연어 처리? 컴퓨터를 이용해 사람의 자연어를 분석하고 처리하는 기술 이미지를 처리할 때와는 다른 특별한 전처리 과정이 필요함, 토크나이징(tokenizing)을 수행

💡 전처리 과정? 원시 데이터를 분석과 모델링에 적합하도록 정리하고 변환하는 작업 예) 데이터 클렌징, 데이터 정규화, 데이터 변환

💡 토크나이징(tokenizing)? 텍스트를 적절한 단위로 나누는 작업 토큰으로 텍스트를 나누어 숫자에 대응시킴 [예) 저는/학생/입니다]

 

 

 

1.5 지도 학습(Supervised learning)

머신러닝 학습 방식 : 지도 학습, 비지도 학습, 자기 지도 학습, 강화 학습

  1. 지도 학습 정답을 알고 있는 상태에서 학습 이미지 분류, 문장 번역 등
    1. 회귀 : 레이블이 연속적인 값인 경우
    2. 분류 : 레이블이 이산적인 값인 경우
  2. 지도 학습의 과정 예시 분류 → 위치 추정 → 객체 탐지 → 분할 → 자세 추정과 얼굴 랜드마크 탐지

 

1.6 자기 지도 학습(Self-supervised learning)

지도 학습의 가장 큰 단점 : 대량의 라벨링된 데이터가 필요 → 많은 비용과 시간 소요 → 자기 지도 학습이 이를 보완 a. 사전 학습 : 실제 풀고자 하는 진짜 문제 대신 가짜 문제를 정의해 해결 (레이블 x 데이터 사용) b. 미세 조정 단계 : 레이블이 있는 데이터를 이용해 일반적인 지도 학습 방식으로 모델 조정

 

 

 

1.7 비지도 학습(Unsupervised learning)

정답이 주어지지 않은 상태에서 데이터의 특징을 스스로 학습 레이블이 없는 데이터에서 패턴이나 구조를 찾아냄

💡 군집화(Clustering) - K-means clustering, DBSCAN 패턴을 분석해서 비슷한 특성을 가진 데이터들을 그룹으로 묶음

💡 차원 축소 - PCA, SVD 데이터의 중요한 특성은 유지하면서 복잡성은 줄임 고차원 데이터 시각화, 데이터 처리 속도 높임

 

1.8 강화 학습(Reinforcement learning)

특정한 행동을 강화 시키는 학습 방식

예) 강아지 훈련

강아지에게 명령 또는 신호를 보냄 → 강아지가 행동을 취함 → 보상을 주거나 주지 않음 → 강아지가 특정 행동을 하면 보상을 받는다는 것을 깨달음

 

 

예) 자율주차

올바른 위치에 주차하도록 가르침

 

환경 생성 → 보상 정의 → 에이전트 생성 → 에이전트 훈련 및 검증의 순서를 거침