[Math] 범함수와 최적제어 변분법의 관계
1. 범함수란?
범함수를 이해하기 위해 함수와 비교해 보자.
- 함수는 실수를 입력받아 실수를 출력한다.
- 범함수는 함수를 입력받아 실수를 출력한다.
예를 들어, 기대값을 계산할 때에는 확률분포함수를 입력으로 하여 실수를 출력한다.
범함수는 보통 대문자로 표기하며 도립변수인 함수를 대괄호로 감싼다.
ex) F[y(x)]
대부분의 범함수 값은 정적분으로 계산한다. 예를 들어, 확률변수 X의 기대값과 엔트로피는 확률밀도함수 p(x)를 적분한 값이다.
2. 최적제어와 변분법
범함수 F[y(x)]의 값을 최대화하거나 최소화하는 독립함수 y(x)를 찾는 것을 최적제어라고 한다.
변분법은 수학의 한 분야로, 범함수의 최소, 최대를 찾는 방법을 가리키는 용어이다.
변분법은 오일러로부터 시작해서 라그랑주가 발전시켰다. 이후 최적제어론과 동적계획법으로 계승되어 발전한다.
변분법의 한 예로 최단시간 강하곡선 문제가 있다. "이 문제는 직선이 최단거리는 되지만 최단시간은 아니다." 라는 것이다.
최단시간의 경로를 푸는 방법은 시간 = 거리/속도의 식에서 t를 적분하는 방식으로 유도해나가는 것이다.
문제의 정의에 따라 이 적분값을 최소가 되게 하는 곡선을 찾아야 한다.
을 오일러-라그랑주 방정식으로 풀면 파란색 선과 같은 사이클로이드 곡선을 얻을 수 있다.(자세한 증명은 생략)
정리:
함수에서는 어떤 함수 값의 최대/최소가 되는 x를 찾기위해 미분을 해서 극대, 극소점을 찾기도 하고 제한조건을 이용하여 찾기도한다. 반면 ,변분법의 개념에서는 어떤 범함수가 최대/최소가 되는 입력함수를 찾는 것이 목표이고, 다시말해 최적제어이다.