본문으로 바로가기

Active learning 이란?

category AI/CV & SSL 2019. 11. 30. 20:26
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

 

 

 

Active learning (능동학습)

 

 

In active learning [9]–[11], the learner receives a set of unlabeled data (videos) for training a visual accurate model, which must be done minimizing the labeling effort by choosing the best training data out of the total amount. This turns out into an iterative process where a human worker labels new automatically selected data in each cycle for model refinement. This contrasts with passive learning, where the training data is selected at random, eventually requiring more labeling budget.

learner는 시각적 정확성 모델을 훈련하기 위해 라벨이 부착되지 않은 데이터(비데오) 세트를 받는다. 이는 총 데이터 양 중에서 최상의 교육 데이터를 선택하여 라벨링 노력을 최소화해야 한다. 이것은 인간 작업자가 모델 개선을 위해 각 사이클에서 자동으로 선택된 새로운 데이터에 라벨을 붙이는 반복적인 과정으로 판명된다. 이는 교육 데이터를 무작위로 선택하여 결과적으로 더 많은 라벨링 예산을 필요로 하는 수동적 학습과 대조된다.

from Self-supervised Domain Adaptation for Computer Vision Task by Jiaolong Xu et al.

 

 

 

There are situations in which unlabeled data is abundant but manually labeling is expensive. In such a scenario, learning algorithms can actively query the user/teacher for labels. This type of iterative supervised learning is called active learning. Since the learner chooses the examples, the number of examples to learn a concept can often be much lower than the number required in normal supervised learning. With this approach, there is a risk that the algorithm is overwhelmed by uninformative examples. Recent developments are dedicated to multi-label active learning,[5] hybrid active learning[6] and active learning in a single-pass (on-line) context,[7] combining concepts from the field of machine learning (e.g. conflict and ignorance) with adaptive, incremental learning policies in the field of online machine learning.

라벨이 부착되지 않은 데이터는 풍부하지만 수동으로 라벨을 붙이는 것은 비용이 많이 드는 상황이 있다. 이러한 시나리오에서 학습 알고리즘은 라벨에 대해 사용자/교사에게 적극적으로 질의할 수 있다. 이러한 유형의 반복적인 감독 학습을 능동적인 학습이라고 한다. 학습자가 예를 선택하기 때문에, 개념을 배우는 예제의 수는 보통 감독되는 학습에 필요한 수보다 훨씬 더 적을 수 있다. 이 접근방식으로, 알고리즘이 비정보적인 예들에 의해 압도될 위험이 있다. 최근의 발전은 온라인 기계 학습 분야의 적응적 증분 학습 정책과 기계 학습(예: 갈등과 무식)의 개념을 결합한 단일 패스(온라인) 컨텍스트에서의 다중 라벨 활성 학습, 하이브리드 액티브 학습[6] 및 능동 학습[7]에 전념하고 있다.