Computer Science/Machine Learning

    [3] 머신러닝 기본개념 - 레이블 (Label)

    머신러닝 모델이 학습할 문제와 정답 중 데이터의 레이블이 정답에 해당한다. 이미지가 주어지고 개인지 고양이인지 맞추라고 하면, 이미지가 문제이고 개라는 레이블이 정답이 되는 것이다. 이 두 문장을 작성하면서도 라벨이라고 쓰고 레이블로 고치고 있는데.. 그냥 같은뜻이긴 하다만 책에 나온 단어인 레이블로 통일하겠다. 국립 국어원도 라벨 레이블 둘다 된다고는 한다. 'label'의 외래어 표기 https://www.korean.go.kr/front/mcfaq/mcfaqView.do?mn_id=217&mcfaq_seq=8974 여튼, 머신러닝 모델은 주어진 문제와 정답으로 구성된 데이터 셋을 통해 학습하기 때문에 지도 학습에서는 그냥 문제만 준다고 해서 학습이 되지 않는다. 이미지 분류라면 이미지가 문제, 분류..

    [2] 머신러닝 기본개념 - 훈련/테스트 데이터 (Training and Test dataset)

    훈련 데이터(Training dataset)와 테스트 데이터(Test dataset)라는 키워드를 생각해보면 이렇게 떠오른다. 모델 훈련에 훈련 데이터를 사용하고, 훈련이 완료된 모델을 테스트 데이터로 검증하여 정확도를 산출한다. 챌린지들에서는 훈련 데이터와 테스트 데이터를 이거로 하라고 주어주고 그냥 모델 최적화만 하도록 주어진다. Training set - a set used for learning and estimating parameters of the model. Validation set - a set used to evaluate the model, usually for model selection. Testing set - a set of examples used to assess the ..

    [1] 머신러닝 기본개념 - 가설공간 (Hypothesis Space)

    가설 공간 (Hypothesis Space) 용어에 대한 정의를 찾아보았다. ... , choosing a representation for a learner is tantamount to choosing the set of classifiers that it can possibly learn. If a classifier is not in the hypothesis space, it cannot be learned. ... A Few Useful Things to Know about Machine Learning / Pedro Domingos https://homes.cs.washington.edu/~pedrod/papers/cacm12.pdf Representation is basically the ..

    [0] The Quest for Machine Learning

    Hulu 데이터 과학팀, 『데이터 과학자와 데이터 엔지니어를 위한 인터뷰 문답집』, 김태헌 옮김, 파주:제이펍, 2020. https://jpub.tistory.com/1057 위 도서의 기반으로 머신 러닝관련 기초 학습을 되새김하려 합니다. 도서 소개 페이지에 공개되어 있는 "필수 스킬 트리" 를 기반으로 글을 작성할 것입니다. 최대한 원 출처 논문을 찾아 보면서 작성하고, 다른 사람에게 설명할 수 있는 정도로 글 작성을 해야 2년간 다른 곳에 가있던 머리가 되돌아 올 수 있을 것 같습니다. 글이 올라오는 주기가 늦어지거나 끊겼다면.. 어딘가 끌려갔거나 나태지옥으로 빠진 것으로 추정해 주십시오.