Deep Learning [3] : 트랜스포머 (Transformer)
·
Artificial Intelligence/Artificial Intelligence Theory
Attention 모델은 자연어 처리에서 중요한 역할을 하며, Encoder와 Decoder라는 두 개의 주요 구성 요소로 이루어져 있다. 예를 들어, 영어를 한국어로 번역할 때, Encoder는 영어 문장을 받아들여 이를 압축된 형태인 **문맥 벡터(context vector)**로 변환한다. 이 문맥 벡터는 문장의 중요한 정보를 요약한 것으로, Decoder는 이를 입력 받아 한국어 문장을 생성한다. 이는 전화기의 원리와 비슷한데, 음성 신호를 압축하여 전송하고, 수신 측에서는 이를 다시 풀어 원래의 음성을 재생하는 방식과 같다. 이렇게 문맥 벡터를 사용하면 연산량이 줄어드는 장점이 있지만, 정보가 한 곳에 집중되어 일부 중요한 세부 사항이 손실될 수 있다. 예를 들어, 영어 문장에서 'The cat..
Deep Learning [2] : 시계열 데이터 신경망 모델 (Time Series Data Learning Models)
·
Artificial Intelligence/Artificial Intelligence Theory
시계열 데이터(Time Series Data)는 특정 시간 순서에 따라 발생하는 데이터를 의미한다. 시계열 데이터의 주요 특징은 데이터의 각 값이 시간이라는 차원에 따라 순차적으로 배열된다는 점이다. 이러한 데이터는 순서가 중요하며, 각 데이터 포인트는 이전 값과 연관이 있다. 즉, 독립적인 데이터가 아니라 시간적으로 연결된 데이터라는 점에서 특수하다. 예를 들어, 주식 가격, 기온 변화, 경제 지표 등의 데이터는 모두 시간에 따라 변화하는 순차적인 특성을 지닌다.순차 데이터(sequential data)는 단순히 데이터가 일정한 순서로 배열된 것만을 의미하지만, 시계열 데이터는 각 데이터 포인트가 시간이라는 차원에 맞춰 배열된 데이터를 말한다. 이때 중요한 점은, 시계열 데이터에서 각 데이터 포인트가 ..
Deep Learning [1] : 딥러닝 모델 개론과 정보 이론과 수학 (작성중)
·
Artificial Intelligence/Artificial Intelligence Theory
1. 딥러닝 모델 딥러닝(Deep Learning, DL)은 머신 러닝(Machine Learning, ML)의 한 분야로, 머신 러닝은 인공지능(AI)의 하위 개념이다. AI는 사람의 지능이나 행동을 모방하는 기술을 의미하며, 머신 러닝은 데이터를 통해 컴퓨터가 스스로 학습하도록 하는 기술이다. 딥러닝은 인간의 뇌, 특히 뉴런의 구조를 모방한 신경망을 이용해 복잡한 학습을 수행하는 기법이다. 현재에는 사람의 고유한 능력으로 컴퓨터가 절대 할 수 없었던 것처럼 여겨졌던 상상을 하고 그것을 그려내는 모델 등이 나오면서 주목을 받고 있다.     불확실성을 직관적으로 이해하자면, 예측하기 어려운 상황을 떠올리면 좋다. 예를 들어 주사위를 던질 때 결과가 어떤 숫자가 나올지 알 수 없어서 불확실성이 큰 상태인..