Byn's Research Note

AI based Mixed Reality, Human-Computer Interaction

↓ My Web CV & Portfolio 자세히보기

2024/09 19

Animation Kinematics [1] : 정방향 운동학 (Forward kinematics)

Forward kinematics는 로봇공학 및 기계공학에서 로봇 매니퓰레이터의 관절 변수를 기반으로 해당 말단 이펙터(end effector)의 위치와 자세를 계산하는 과정이다. 이는 로봇의 각 관절에 대해 주어진 회전각 또는 변위와 같은 값을 이용하여 공간상에서의 이펙터의 위치를 수학적으로 결정하는 것을 말한다. 일반적으로 로봇의 구조적 체인과 관절 정보는 변환 행렬(transformation matrix)이나 좌표계를 사용해 표현되며, 이를 통해 기구학적 연산을 수행한다. Forward kinematics는 로봇의 작업 공간(workspace)을 분석하거나 목표 지점에 도달할 수 있는지를 평가하는 데 중요한 역할을 하며, 이를 계산하기 위해 Denavit-Hartenberg(DH) 매개변수와 같은 ..

Vision Theory [2] : 에지 & 코너 검출 및 포인트 매칭

1. What are Edges? 이미지에서 밝기 변화가 급격히 일어나는 지점인 Discontinuities in intensity는 에지(edge)로 이는 물체의 형태와 구조를 정의하는 데 필수적이다. 예를 들어 풍경 사진에서 하늘과 땅의 경계선이 바로 에지의 대표적인 예가 된다. 이 에지는 하늘의 푸른 색상과 땅의 갈색 또는 녹색 사이의 갑작스러운 밝기 변화로 형성된다. 반면, 경계(boundary)는 이러한 에지를 통해 물체를 구분하는 의미 있는 경계 부분으로 볼 수 있다. 같은 사진에서 산의 경계선은 에지이기도 하지만, 그것이 특정한 산이라는 물체를 정의하므로 경계로도 이해될 수 있다. 이러한 경계는 물체 간의 구분을 명확히 하여 이미지의 의미를 전달하는 데 중요한 역할을 하며, 에지의 하위 집합..

Deep Learning [0] : 딥러닝 기본 개념

인공지능(Artificial Intelligence, AI)은 기계가 인간처럼 학습하고 사고하며 문제를 해결할 수 있도록 만드는 기술이다. 이는 데이터를 분석하고 패턴을 찾아 인간의 사고를 모방하는 시스템을 개발하는 것에서 시작된다. 다른 것들에서 공통점을 찾고, 비슷한 것들에서 차이점을 찾는 것이라는 표현은 AI의 핵심 원리를 매우 간단히 설명한 것이다.   예를 들어, 사진 속에서 고양이와 개를 구분하는 AI 모델을 만든다고 하자. AI는 먼저 다양한 동물 사진(고양이와 개를 포함한 여러 동물)을 관찰하며 학습한다. 다른 것들에서 공통점을 찾는 것은 AI가 고양이와 개의 이미지를 다른 동물의 이미지와 비교하면서 고양이와 개만의 공통된 특징(예: 네 발, 털이 있음)을 발견하는 과정이다. 반대로, 비슷..

Animation Kinematics [0] : 운동학 기초 (Fundamentals to Kinematics)

운동학(Kinematics)은 물체의 운동을 기술하는 고전 역학의 한 분야이다. 운동학에서는 물체가 어떻게 움직이는지 설명하며, 움직임을 발생시키는 원인인 힘이나 토크는 고려하지 않는다. 이는 위치, 속도, 가속도 등의 물리량을 중심으로 분석하며, 로봇의 관절 각도 계산, 애니메이션 캐릭터의 자세 변경 등 다양한 응용 분야에 사용된다.순방향 운동학(Forward Kinematics): 주어진 입력(관절 각도 등)을 기반으로 결과 위치(말단 위치)를 계산한다.역방향 운동학(Inverse Kinematics): 목표 위치를 기반으로 이를 만족하는 입력(관절 각도 등)을 계산한다.더보기역학 (Mechanics) 역학(Mechanics)은 물체의 힘, 운동, 상호작용을 다루는 학문으로, 두 가지 주요 분야로 나..

UI & UX Programming [0] : 사용자 경험과 사용자 인터페이스 (정리중)

UX(User Experience) : 사용자가 제품, 서비스, 혹은 시스템을 이용하면서 느끼는 전체적인 경험을 의미한다. 이는 단순히 제품의 기능뿐만 아니라 사용 과정에서 느끼는 감정, 만족도, 인지적인 부분까지 포괄한다.UI(User Interface) : 사용자가 제품과 상호작용하는 시각적 요소를 의미한다.​웹사이트를 예를 들면 UI는 사이트의 아이콘, 디자인, 폰트, 색상 등 시각적인 요소, UX는 사이트의 정보 구조, 사용 편의성, 콘텐츠의 질, 사용자의 만족도를 의미하는 것이다. UI와 UX는 구분되는 요소이지만 서로 밀접하게 연관이 있다. 좋은 UI는 사용자에게 긍정적인 UX를 제공할 수 있기에 좋은 UX를 위해서는 좋은 UI가 필수적이다.

Vision Theory [1] : 이미지의 정보와 처리

컴퓨터 비전에서는 이미지 정보와 처리의 원리를 잘 이해하는 것이 중요하다. 이미지 처리는 객체 인식, 추적, 분할 및 분석과 같은 컴퓨터 비전의 핵심 기술을 지원하며 효과적인 노이즈 제거, 화질 개선 및 이미지 변환 기술을 통해 실제 환경에서 얻은 데이터를 보다 신뢰할 수 있는 형태로 변환하여 정확한 결과를 도출할 수 있다. 그리고 이미지의 기하학적 특성을 이해하면 왜곡을 보정하고 다양한 시점에서의 3D 재구성을 가능하게 하여 더욱 현실적인 분석과 응용을 지원한다. 이러한 원리는 머신 러닝 및 딥 러닝 알고리즘과 결합되어, 이미지 기반 데이터의 처리 및 분석에 필수적인 기초 지식을 제공한다. 따라서 이미지 처리 원리에 대한 깊은 이해는 컴퓨터 비전 시스템의 개발 및 최적화에 있어 필수적이다.  1. Ca..

Graphics Theory [2] : 변환

컴퓨터 그래픽스에서 변환(Transformation)은 3D 공간에서 객체의 위치, 방향, 크기를 조작하는 데 사용하는 수학적 연산으로 이동 변환, 회전 변환, 축소/확대 변환, 전단 변환, 투시 변환 등이 있다. 예를 들어, 게임 엔진에서는 이동 변환을 통해 캐릭터를 위치시킬 수 있고, 회전 변환으로 캐릭터의 방향을 조정하며, 축소/확대 변환으로 객체의 크기를 조절 할 수 있다. 구체적인 변환의 수학적인 행렬을 알아보기에 앞서 변환 그룹에 대한 이해를 해두는 것이 좋다, ​더보기Transformation Group 변환을 행렬로 간단하게 표현하기 위해선 잘 정리되어있는 성격이 필요한데, 변환 그룹의 세가지 성격을 서로 다른 변환들이 가지고 있다면 그 변환을 그룹으로 표현할 수 있다. 변환 그룹은 변환 ..

Graphics Theory [1] : 모델링과 메쉬

모델링은 모델링은 3D 공간에서 객체를 만드는 과정이다.​Polygon : 폴리곤은 폴리곤은 2D 공간 또는 3D 공간에서 선분으로 연결된 세 개 이상의 점으로 이루어진 폐곡선으로 3D 객체를 표현하는데 가장 기본적인 단위이다. 라인 루프로 닫혀진 오브젝트 이지만 내부를 가지고 있다. 폴리곤은 변의 수에 따라 n각형으로 분류되고 삼각형은 주로 게임 모델링, 사각형은 라이팅과 필름메이킹에 주로 이용된다.​Polygonal Mesh : Polygonal mesh는 3차원 컴퓨터 그래픽에서 polygon의 모음으로 이루어진 객체를 표현하는 데이터 구조로 각 다면체는 3개 이상의 점으로 구성되며, 이 점들은 선으로 연결되어 표면을 형성한다.​ (좌) Polygon의 종류와 (우) Triangle polygon으..

Calculus [0] : 변화율과 근사의 미분적분학 (정리중)

1. 미분적분학의 발상James Steward Calculus미적분학은 고등학교 때부터 대학 전공 기초에 이르기까지 오랜 시간 공부해온 과목이지만, 그 본질에 대해 직관적으로 이해해야만 응용하고 적용할 수 있다. 미적분을 학습하는데에 중요한 것은 곱의 미분법, 연쇄 법칙, 음함수의 미분법, 미분과 적분의 관계, 테일러 급수같은 핵심 발상을 다루면서 그 많은 공식들이 실제로 어디에서 왔는지, 그것들이 의미하는 바는 무엇인지 포괄적인 시각적 접근을 통하여 명확히 이해해야한다. 마치, 수학을 발명한다는 감각을 느낄수 있어야 한다.큰 수가 작은 것들의 합으로 근사될 수 있는 문제들은 특정 그래프 아래의 면적에 관한 문제로 해결할 수 있다.미분적분학이 중요한 이유​Circle먼저 기하학의 매우 특정한 형태인 원의..