About Human

Computer Vision을 위한 뇌 역공학 (7) - V1

빠릿베짱이 2013. 5. 1. 00:45
반응형

 

 

LGN으로부터의 신경다발은 이제 대뇌피질로 들어갑니다. 시각을 처리하는 대뇌피질은 대뇌의 후반부에 주로 위치합니다. 이 중 기능이 잘 밝혀진 시각영역을 따로 'V숫자'로 표시합니다. (이에는 V1~V5가 있습니다.) 이중 이제 살펴볼 V1은 제일 처음 신경다발을 받아들이는 곳으로서 염색을 하면 세포의 배열이 줄무늬를 이루고 있어서 striate cortex라고도 부릅니다. (한글로는 선조피질) 이외의 V2~V5는 extrastriate cortex라 하고요. 문헌에 따라 부르는 이름이 틀리므로 잘 알아둘 필요가 있습니다. 보통 V1이라 많이 부르고 그 다음 1차시각영역이란 의미에서 primary visual cortex 또는 striate cortex라 하지만 원래 뇌 영역 번호에 따라 Area 17이라 부르는 문헌도 있습니다.

위 왼쪽 그림처럼 상당히 좌우 뇌 사이에 숨어있습니다. (시각처리시스템을 보호하려는 걸까요?)

그리고 위 오른쪽 그림처럼 쭈글쭈글한 뇌 주름을 따라 시각영역은 분포합니다. 재미있게도, 이렇게 주름져있음에도 망막의 위치관계를 v2까지는 (어쩌면 V3도) 그대로 유지한다는 점입니다. V1에 대한 구조적, 행태적 연구는 80년대에 Hubel과 Wiesel에게 노벨상을 안겨주었고 이들의 연구는 곧바로 NHK 연구소에 근무하던 Fukunaga에게 영감을 주어 Cognitiron, Neocognitron의 개발로 이어졌습니다. Neocogntiron은 다시 MIT BCS과 CBCL의 Serre에 영향을 주어 현재 가장 진보된 Visual Object Categorization 시스템 개발에 영감을 주었습니다.

자 이제 비교적 잘 밝혀진 V1의 구조에 대해 알아보겠습니다.

그 전에 우리는 대뇌피질을 이루는 보편적인 6층구조에 대해 잠깐 살펴보겠습니다. 신용카드 두께인 2mm의 대뇌피질에는 다음과 같이 6층의 구조가 반복되어 나타납니다.

이런 구조를 열구조(columnar structure)라 부릅니다. 이런 하나의 구조가 10의 n승 단위로 모여 뇌과학자들이 보통 부르는 구조를 형성하고 있습니다. 이의 모형화는 다음과 같습니다.

 

각 층에 대해 알아둘 것은 다음과 같습니다.

(맨 위부터)

1층 : 다른 column으로부터의 신호를 받음

2, 3층 : 주된 정보처리를 수행하고 그 결과를 다른 곳으로 보냄.

4층 : 입력층.

5, 6층 : 출력층. 특히 운동과, 시상으로 가는 지연신호를 출력하는 층.

특히 5층에는 전체에서 보통 가장 거대한 피라미드 뉴런이 존재함.

즉, 4층으로부터 입력을 받아 2,3 또는 5,6층에서 처리를 하고 다시 신호를 다른 곳으로 전달하는게 보편적인 작동방식입니다.

V1의 경우는 이런 층간의 분업이 매우 뚜렷이 나타납니다.

이것이 V1의 한 처리단위(망막의 한 위치에 대응하는)의 구조입니다. 편의를 위해 배선부인 1층은 생략되었으며 4층이 복잡히 나타내어졌음을 볼 수 있습니다. 이제부터는 이 연재의 본 목적인 시각처리구조에 있어 반드시 암기가 따라야하는 내용임을 밝힙니다. (그러나 전부는 아니고, 외워야하는 것은 따로 간단한 그림과 요약으로 말미에 나타내겠습니다.) 암기가 어려우신 분은 세미나때 들으면 좀 나으실겁니다. 그러나 뇌의 역공학을 통해 CV 알고리즘을 얻으려 한다면 힘들지만 암기는 피할 수 없습니다.

위 그림을 살펴봅시다. 4층을 4A, 4B, 4C의 세 sub층으로 나누었고 4C는 다시 4Cα와 4Cβ로 나누었습니다. 이런게 불편하시다면 4층은 총 4층으로 생각하고 전체는 1, 2, 3, 4A, 4B, 4Cα, 4Cβ, 5, 6의 9층으로 생각하는게 편합니다.

세부적으로 들어가기 전에, P와 M경로에 대해 먼저 알아봅시다.

반응형