반응형

Algorithm 82

Improving Deep Neural Networks : Hyperparameter tuning, Regularization and Optimization : Coursera 강좌 Deeplearning.ai 정리

Setting up your Machine Learning Application 1. Train / Dev / Test sets Train Set : 학습을 위한 데이터 셋Dev Set : Cross validation Set Train set으로 학습한 모델들을 비교하여 좋은 모델을 선택하기 위함즉 어떤 모델을 선택할지 결정되므로, 이 또한 학습에 영향을 미친다는 것을 의미Test Set : 학습과정에서 전혀 본적없는 데이터 셋으로 학습된 모델을 평가하기 위한 데이터 셋이는 학습된 모델이 얼마나 잘 학습 되었나를 검사하기 위한 목적, 혹시나 오버피팅이 되지 않았나..예전에는 60%/20%/20%로 데이터를 나누고 실험을 수행했으나, 요즘에는 데이터가 매우 많아서 98%/1%/1%로 분리하여 실험해도 됨..

Linear Model for Regression

Linear Model for Regression 3.1 Linear Basis Function Models Regression을 위한 가장 간단한 선형 모델은 입력 변수의 선형 조합을 포함한다.$eq. 3.1$ $y(x,w) = w_0 + w_1 x + ... + w_d x_d$ 여기서 $x=(x_1,..., x_d)^T$이다. 이것은 종종 Linear Regression으로 알려져 있다. 이 모델의 중요한 속성은 파라미터 $w_0, ..., w_D$의 선형 함수라는 것이다. 하지만 이것은 입력 변수 x의 선형 함수이며, 이것은 이 모델의 중요한 한계로 작용한다. 따라서, 우리는 입력 변수의 고정된 비선형 함수의 선형 조합을 통해 모델의 클래스를 확장한다.$eq. 3.2$ $y(x,w)=w0+\sum{..

Algorithm 2017.07.06

Thompson Sampling(톰슨 샘플링)

중국 블로그 : http://x-algo.cn/index.php/2016/12/15/ee-problem-and-bandit-algorithm-for-recommender-systems/시뮬레이터 : https://learnforeverlearn.com/bandits/Python Sample code(파이썬 샘플 코드) : http://mloss.org/software/view/415/https://github.com/bgalbraith/bandits 논문 : Analysis of Thompson Sampling for the Multi-armed Bandit Problem ( 링크 ) 톰슨 샘플링 시뮬레이션 결과( result of thompson sampling simulation) 1. 가장 좋은 보..

Algorithm 2017.06.27

A simple neural network module for relational reasoning

Link : https://arxiv.org/pdf/1706.01427.pdf A simple neural network module for relational reasoning Abstract 관계 추론(Relational reasoning)은 일반적으로 지능적인 행동의 중심 구성 요소이지만 신경망이 학습하는 것이 어렵다는 것이 입증되었습니다.본 논문에서는 관계형 추론에 근본적인 문제를 해결하기 위해 간단한 플러그 앤 플레이 모듈로 RN (Relation Networks)을 사용하는 방법을 설명합니다.우리는 RN-augmented 네트워크를 다음 세 가지 작업으로 테스트했습니다. CLEVR이라는 까다로운 데이터 세트를 사용하여 시각적 인 질문 응답을 제공합니다. CLEVR은 최첨단의 초인적 인 성능을 ..

Algorithm/Paper 2017.06.07

vector similarity

일반적으로 데이터의 feature들을 벡터로 구성하고, 벡터간의 유사도를 구할때는 "Cosine distance"나 "Euclidean distance"를 사용합니다. 저도 프로젝트를 할때, 벡터간 유사도를 사용할때 "코사인 유사도"를 사용했습니다. (그냥 주로 그걸 쓰니까..?) 근데, 2016 IEEE에서 2가지 방법에 대해 단점을 논하고, 새로운 벡터간 유사도를 구하는 방법이 제안됐습니다. 논문제목은 "A Hybrid Geometric Approach for Measuring Similarity Level Among Documents and Document Clustering" 이고, 방법론은 TS-SS라고 불리는 measure입니다. 논문을 요약정리해서 깃허브에 올렸습니다. 추가적으로, TS-SS..

Algorithm 2017.04.13

Face Alignment Warping

Face Alignment WarpingCode : https://github.com/t0nyren/piecewiseAffinecode : https://github.com/dougsouza/face-frontalization 얼굴 검출->랜드마크 검출 -> 정면으로 와핑1. 입력 : 영상 및 input Landmark , Target Landmark2. 알고리즘1. Landmark를 기준으로 dx, dy 맵 생성2. delaunay 삼각 분할 생성3. Grid의 위치에서 삼각형과 관계를 통해 weight 값 계산하고, dx, dy 업데이트4. dx, dy를 이용하여 보간하면서 warping 얼굴 데이터베이스 활용 Code : https://github.com/t0nyren/AverageFace 매트랩으..

Algorithm/Face 2016.07.16

ImageNet Classification with Deep Convolutional Neural Networks

Alexnet Introduction 기계 학습을 통한 객체 인식의 경우 데이터 셋을 필요로 한다.하지만, 기존에는 적은 양의 데이터 셋만 공개되어 단순한 인식 과제들만 수행되었다.최근에는 LabelMe와 ImageNet와 같이 많은 수의 데이터셋가 존재한다. LabelMe는 수백에서 수천 개의 완전히 분할된 영상으로 구성되며, ImageNet은 2만 2천개의 카테고리를 갖는 1,500만개의 정답있는 고해상도 영상으로 구성된다. 이렇게 수많은 데이터를 학습시키기 위해서는 좀 더 큰 학습 능력을 가진 모델이 필요함CNNs이 이러한 모델로 여겨진다.CNNs은 신경망의 깊이와 폭 변화로 제어 가능함.CNNs은 표준 Feedforward 신경망과 비교할 때, 훨씬 더 적은 수의 연결과 파라미터를 갖기 때문에좀더..

반응형