About Human

Computer Vision을 위한 뇌 역공학 (8) - M과 P경로

빠릿베짱이 2013. 5. 1. 00:46
반응형

 

우리 뇌는 시각정보를 처리할 때 "물체가 어디에 있는가"와 "물체가 무슨 물체인가"를 각각 따로 처리합니다. 각각, 뇌의 위쪽 경로를 따라 처리되는 "어디에"의 경로를 where stream 또는 dosal stream이라 하고 "무엇?"을 알아내는 경로를 what stream 또는 ventral stream 이라 하죠. where stream은 motion을 분석하는 경로, what stream은 object recognition을 수행하는 경로라고 말하기도 합니다. 각각의 최종노드는 dosal(where) stream의 경우 정수리께의 MT, ventral stream의 경우는 관자놀이의 IT가 맡고 있습니다. 이 둘은 당연히 서로 정보를 교환하며 작동되기는 한데 역시 where가 먼저 처리됨은 자연스럽다 하겠습니다.

 

위 그림을 보면 MT가 IT보다 일찍 작동을 시작해 일찍 완료됨을 알 수 있습니다. 즉, "어디에 있는지"를 먼저 처리하고 "무엇인지"를 처리합니다. 위의 양상의 세부적인 사항은 실험마다 틀리나 MT와 IT의 관계는 대략 비슷합니다. (그렇지만 MT가 꼭 끝나야 IT가 활동을 시작하는 것은 아닙니다.)

뇌의 정보처리 흐름에 관해 비교적 확실한 지식은 이 두 흐름입니다. 그리고 이는 전체를 결정하는 중요한 흐름이기도 합니다. 이제 우리가 이미 접한 M과 P경로는 이들과 어떤 관계인지 알아봅시다.

 

이것이 M과 P경로입니다. 회색으로 된 부분이 M경로이고 이는 PPC 직전에 V5를 거침을 볼 수 있습니다. 그런데 MT는 V5의 다른 이름입니다. 반면 회색이 아닌 영역은 P로 시작해 IT에서 끝남을 볼 수 있습니다. 중간에 둘간의 연결이 V3를 통해 있기는 하나 크게, MT에서 끝나는 경로와 IT에서 끝나는 경로가 각각 M경로, P경로와 일치함을 알 수 있습니다. (매우 다행이죠.) 즉, 망막에서의 구분(M과 P의)은 실제로 뇌의 정보처리의 구분과 일치함을 알 수 있습니다. 그리고 이제는 해부학적 관점에서 더 맞는 M과 P경로를 where 경로와 what 경로 대신 취하겠습니다.

우선 바로 위의 그림은 우리가 다루기엔 충분히 단순하지 않습니다. 우선 맨 아래 SB로 시작하는 K경로는 진화상 오래된 시스템으로서 그 역할이 미미합니다. 따라서 제거합니다..

다음, 그림 중간 세로줄무늬 부분의 노드도 제거합니다. 이는 color에 대한 처리노드로서 저는 앞으로 color를 완전히 배제한 설명을 할 것이기 때문에 제거합니다. Color는 현 시점의 CV 연구를 볼 때 그 이용이 매우 미미합니다. 그 이유는 두가지일 것입니다. "Color외에도 밝혀야할게 더 많다." 그리고 "Color를 다루면 처리량이 매우 많아진다"입니다. 여기에 더해 "Color를 고려하지 않아도 대부분의 경우 아무 문제가 없더라"라는 경험적인 이유가 있습니다.

위의 흐름도를 조금 더 설명할때, 인간이 시각인식을 위해 사용하는 차원은 기본적인 수준에서 네가지 입니다.

1. Motion

2. Depth

3. Color

4. Edge

쉽게 생각해, 이들 각각이 map을 이루고 이 네 map을 함께 이용해 외부세계를 인지하는게 인간의 시각처리 방식이라고 보시면 됩니다. 그런데 color는 빼도 큰 지장이 없습니다. 우리가 개가 사람과 별반 차이없는 외부인지를 하는 것을 알지만 개는 색을 전혀 사용하지 않습니다. 이러한 이유로 설명의 편의를 위해 color를 배제하려는 것입니다. (그러나 대부분의 심리학, 의학책은 color를 중요히 다룹니다. 제가 볼 땐 모형화를 해보지 않은 때문이라 봅니다. 모형화를 위해선 과감히 중요하지 않은 것은 빼야 하죠.)

위 흐름도에서 color를 빼면 다음과 같이 단순해집니다. (제가 직접 그렸습니다.) 

이 흐름도는 CV를 위한 뇌역공학에서 반드시 외워야하는 그림입니다. 이에 대한 설명을 이제 시작할까 합니다.

참고로 아래는 앞으로 알아갈 위 그림의 더 자세한 버젼입니다.

반응형