반응형

분류 전체보기 453

FFMpeg x264 Header 패킷 분석

FFmpeg 에서 디버깅 메시지 출력하게하는 함수 av_log_set_level(AV_LOG_DEBUG); x264로 인코딩할 경우에 데이터는 NAL이라는 것으로 사용되는 것 같음. 분석 결과 0x00 0x00 0x00 0x01 또는 0x00 0x00 0x01 로 시작되는 것이 Start Code 같음. 키 프레임의 경우 총 3~4개의 NAL로 구성되어있는 듯함. 처음 프레임의 경우에는 인코더 정보에 대한 문자열을 포함하여 4개의 NAL로 구성되며, 다음부터 키프레임은, 3개의 NAL로 구성된다. Start Code 뒤에 0x67, 0x68, 0x41, 0x01, 0x65, 0x06 이런식으로 나오는데 분석 결과 0x06 : NAL_SEI 맨 처음 프레임에서 나오는데, uuid와 기타 코덱 정보를 가지고..

Programming/MFC-C++ 2013.04.02

RANSAC(RANdom SAmple Consensus)

1980년도 원전 논문 RANDOM SAMPLE CONSENSUS : a Paradigm for Model Fitting with Applications to Image Analysis and Automated Cartography (http://www.dtic.mil/dtic/tr/fulltext/u2/a460585.pdf) RANSAC(RANdom SAmple Consensus)을 이용한 Line Fitting Example http://blog.daum.net/pg365/62 RANSAC 은 노이즈가 심한 원본 데이터로부터 모델 파라미터를 예측하는 방법이다. 위의 링크에는 line fitting을 예제로 하였으나, 실제로 cost와 모델링하는 함수만 만든다면 2차 곡선, 3차 곡선, 기타 모델링을 ..

Algorithm 2013.04.02

Spherical Blurred Shape Model for Hand Pose Recognition

먼저 이 논문은 손의 동작(Pose)를 인식하는 방법에 관한 논문이다. 전체적인 구성은 먼저 키넥트로부터 영상을 입력받고, 손 영역을 찾고 손 영역에서 본 논문이 제안하는 SBSM (Spherical Blurred Shape Model) 디스크립터를 추출한다. 추출된 디스크립터로 사전에 SVM으로 학습한 모델을 이용하여 인식하는 것이다. 손은 기본적으로 카메라에서 가장 가까이 있다고 가정하고 찾는 듯 하다. 그래서 일단 이부분은 중요한 부분이 아니니 패스~ 중요한 포인트는 찾아진 손 영역에서 어떻게 디스크립터를 추출하느냐 이다. 그림 4.1을 보면 피와 세타 r을 볼 수 있다. 간단하게 말해서 3차원 히스토그램이라고 보면 되지 않을까 싶다. O는 무게중심일 것이며, 무게중심을 기준으로 phi 와 thet..

Algorithm/Paper 2013.03.29

Kinect for Window & OpenNI 동시 설치 및 사용하기

ㅇ 설치 준비 사항 1. Kinect 장비 ( window 용 or xbox 용) 2. Kinect for Windows SDK 와 Developer Toolkit 여기서 사용한 버전은 1.6 다운로드 링크 : http://go.microsoft.com/fwlink/?LinkID=262831 웹페이지 링크 : http://www.microsoft.com/en-us/kinectforwindows/develop/developer-downloads.aspx 3. OpenNI v1.5.4.0 (32bit) http://www.openni.org/openni-sdk/openni-sdk-history-2/ 4. NiTE v1.5.2.21 ( 32bit) http://www.openni.org/openni-sdk/o..

Programming/MFC-C++ 2013.03.26

태국 푸켓 신혼여행

드디어 결혼식을 마치고, 신혼여행을 떠났다. 장소는 푸켓~~~~ 너무 바쁘고 정신이 없어서, 자료 조사도 하지 못하고, 무작정 여행사 자유여행 패키지만 믿고 비행기에 올랐다. 나 같은 사람을 위해서 푸켓 가기전에 꼭 알아야할 Tip 에 대해서 몇가지 정리해보려고 한다. 1. 대한민국에서 태국지폐 바트로 환전하기 쉽지 않기 때문에 달러로 교환하자. 달러는 50달러 또는 100달러 지폐로 대략 한 500~600달러 정도면 무난하게 쓸수 있지 않을까 싶다. 50 또는 100달러 지폐로 교환하는 이유는 가보면 알겠지만, 태국에서는 지폐에 따라서 환률 단위가 다르다. 50 또는 100 달러의 환율이 가장 높다. 그렇기에 50 달러나 100달러 지폐로 환전하여 가져가길 바란다. 2. Tip - 몇달전에 샌프란시스코..

Travel 2013.03.25

GLCM(Gray-Level Co-occurrence Matrix) & Haralick texture features

o GLCM ( Gray-Level Co-occurrence Matrix) 항상 느끼는 것이지만 알고리즘은 공부하고 사용하지 않다보면 잘 잊어버리게되네요. 이것도 예전에 공부했던 내용인데, 다시 보니 기억이.... 그래서 결국 이참에 정리를 하게 됩니다. 먼저 GLCM 구하는 방법을 보면 다름과 같습니다. 위의 그림 하나면 설명이 끝납니다. 좌측 메트릭스는 영상이라고 생각해봅시다. 영상의 픽셀 값은 설명을 위해 0~3까지 총 4단계로 구성되죠. 따라서 GLCM 도 4 * 4 메트릭스가 나오는 것입니다. 먼저 가로로 두개씩 보는 것입니다. 예를들어, 좌측 그림에서 가장 상단의 좌측 픽셀 두개는 0, 1 입니다. 이것의 의미는 (0, 1) 이라는 의미, 즉, x = 0, y= 1 이라는 의미입니다. 이 좌표..

Algorithm 2013.03.05
반응형