공부하는 안씨의 기록
[개념] 딥러닝 기초 개념 정리 (2) 딥러닝과 다층 퍼셉트론 (+활성화 함수를 사용하는 이유) 본문
이번 여름방학(24/7/1~7/26)동안, 수도권 ICT 이노베이션 스퀘어 강의인 인공지능 중급 강의를 수강하며 스스로 정리하고 추가 조사한 내용을 토대로, 공부의 목적으로 딥러닝 개념 정리를 해보고자 한다.
이전 챕터에서는 머신러닝과 딥러닝의 차이점에 대해 알아보았다.
그런데, 그래서 인공신경망을 어떻게 구현한걸까?
이번 챕터에서는 인공신경망을 활용한 딥러닝,
즉 '딥러닝의 다층 퍼셉트론 개념'에 대해 알아보겠다.
아래는 강의를 수강하고나서 필기한 내용을 바탕으로 구글링 및 각종 티스토리와 유튜브 강의를 참고하며 스스로 정리해본 내용이다. "그래서 딥러닝이 뭐하는거고, 어떻게 작동하는 건데?" 에 대한 의문을 최대한 쉽게 정리하기 위해 노력했다. 가장 도움이 많이 된 유튜브 강의는 페이지 하단에 첨부하였다.
정리하자면, '은닉층'이라는 layer를 추가한 '다층 퍼셉트론'에서, 활성화 함수를 사용한 '딥러닝 알고리즘'은, 예측값과 실제값과의 오차를 최소화하기 위해 여러 방법을 사용한다. 이때 다양한 수학적 원리가 사용되며, 계산의 용이성을 위해 tensorflow 라이브러리를 사용한다. 활성화 함수는 이진분류를 할지, 다항분류를 할지에 따라 다른 함수를 사용하며, 데이터 및 결과를 살펴보며 다른 함수를 적용하여 사용하는 것이 더 유리할 수 있다.
그런데, 활성화 함수는 왜 쓰는 걸까?
활성화 함수를 쓰는 이유는 선형 데이터를 '비선형'으로 만들어주기 위해서이다. 활성화 함수를 쓰지 않거나 선형 활성화 함수를 사용하면 단일 퍼셉트론과 결과적으로 동일하므로, 다층 퍼셉트론이라 할 수 없다. 예를 들어 학습 시간을 바탕으로 시험 성적을 예측하기 위해 입력된 기존 데이터를 분석할 때, 일반적으로 학습시간이 증가할 수록 성적이 증가하는 경향을 보일 수 있지만, 학습시간이 과하게 많은 경우 오히려 시험 성적이 떨어질 수 있다. 이때 선형 함수를 활성화 함수로 사용하게 되면 데이터의 끝단에서 감소하고 있는 경향을 반형하지 못한다. 반면 곡선 형태의 볼록한 비선형 함수를 사용하면 이런 데이터 또한 반영할 수 있다. (위의 그래프 이미지 참고!) 이것이 비선형 활성화 함수를 사용한 '딥러닝 다층퍼셉트론'이다. 비선형 활성화 함수를 사용해야 '딥러닝'의 다층퍼셉트론이라 할 수 있다.
(아직도 의문이 해결되지 않았다면 이 링크의 티스토리를 참고하는 것이 도움이 된다.)
개인적으로 머신러닝과 딥러닝의 차이를 파악하고, 그래서 딥러닝은 왜 하는 것이며 어떤 차별점이 있는 것이고, 그 차별점의 원리는 무엇인지 궁금했는데 딥러닝 알고리즘의 흐름을 대략적으로 확인할 수 있어서 좋았다.
아래는 딥러닝을 쉽게 이해할 수 있는 유튜브 강좌 링크이다.
유튜버 코딩애플의 강좌를 참고하였으며 1시간정도 듣다보면 흐름이 아주 쉽고 재밌게 이해된다!! 너무너무 추천!!!
https://www.youtube.com/watch?v=ivfp2wpPLzs
'인공지능 > 딥러닝' 카테고리의 다른 글
[딥러닝] 순전파와 역전파(Backpropagation) (0) | 2025.02.16 |
---|---|
[개념] 딥러닝 기초 개념 정리 (4) 모델 성능 검증 (k겹 교차검증, 과적합) (0) | 2024.07.24 |
[개념] 딥러닝 기초 개념 정리 (3) 이진분류와 다중분류 (2) | 2024.07.23 |
[개념] 딥러닝 기초 개념 정리 (1) 머신러닝과 딥러닝의 개념 및 차이점 (2) | 2024.07.13 |