본문 바로가기
카테고리 없음

데이터 라벨링 AIDE 1급 자격증 후기 및 기출문제

by QuidamAnima 2023. 10. 18.
반응형

데이터 라벨링이라는 직업은 미래가 있을까?

 

N잡러의 파이프라인 중 하나인 데이터 라벨링이라는 직업이 있다. 초기에는 (약 5년전이니까 2018년도 쯤이라고 해두자) 데이터 라벨링 작업을 통해 평균 월급 이상을 벌어가는 사람들이 많았고, 그래서 더 관심을 받게 된 분야이기도 하다. 그러나 2023년 10월 현재기준, 오픈 카카오톡방에서 오가는 대화며, 데이터 라벨링의 가장 큰 사이트인 크라우드웍스 카페글 등을 보면 올해부터 데이터 라벨링 작업이 현저하게 줄었으며 그래서 자격증 필요 여부에 대한 의구심도 많다.

결론부터 말하면 데이터 라벨링 자격증은 '꼭' 필요하지는 않다. 다만, 데이터 라벨링이라는 단어를 처음 접하고, 어떤 작업을 하게 될지에 대한 염려가 있다면 자격증 획득은 추가적으로 생각해볼만한 '충분하' 가치가 있다. 이 글을 쓰고 있는 나 역시 자격증 획득을 위한 내배카 수업을 통해 차근차근 공부하는 중에 데이터 라벨링 재택 작업에 충실히 구직활동을 했고, 작업 중에도 공부한 내용들은 매우 큰 도움이 되었다. (일단 굉장히 꼼꼼해야 한다. 처음에는 모니터를 너무 눈이 빠져라 보고 있어서 눈 피로가 상당했다) AI시대니, 빅데이터니 주변에서 들려오는 익숙한 단어들과 늘 접하면서도 내 일상에 큰 변화를 느끼지 못하고 있었는데, 현재 하고 있는 데이터 라벨링 작업들을 보면 시대가 어떤식으로 변하고 있는지, 현재 작업하는 자료가 왜 필요하고 어떤 식으로 쓰일지 감이 온다. 올 한해는 정부 지원금이 줄어들면서 현저하게 일자리가 줄어들긴 했지만, 앞으로도 데이터 라벨링은 점점 높은 수준을 요구하는 역할로 반드시 필요 할 것으로 보인다.

 

데이터 라벨링 AIDE(Artificial Intelligence Data Expert) 자격증 시험

 

데이터 라벨링은 새로운 분야여서 그런지 아직 공인 자격증은 없는 게 현실이다. 다만 구직 시 이력서에 추가용으로는 좋다. 내가 아무리 데이터 라벨링 작업 경험이 많다고 한들 인증 할 수 있는 열마디 말보다 자격증 하나가 구인을 하는 입장에서는 도움이 될 테니까. 현재는 한국인공지능자격센터에서 민간 자격증을 주고 있다. 정식 명칭은 <인공지능(학습)데이터전문가>로 2급과 1급으로 나누어져 있다. 2급을 따야 1급 시험을 볼 수 있는 자격이 주어진다. 1,2급 모두 매주 수요일과 토요일에 시험이 있으니 개인의 학습과정 스케쥴에 따라 시험을 신청하면 된다. 학습과정과 시험이 합쳐져 있는 과정이 있기도 한데, 내일배움카드로 내돈 안나고 학습과 실습만 하고, 시험 신청을 해도 충분히 합격이 가능한 수준이다. 응시료는 1급과 2급 각각 7만원씩이다. 공인 자격증이 아니라 더 비싼걸로 미루어 짐작만 해본다. 시험에서는 기본적인 인공지능 지식에 대한 질문과 내일배움카드에서 이수했던 학습 과정 중 실습 해 봤던 내용을 다루고 있다. 즉, 1급이던 2급이던간에 기본이론/실습 이렇게 두 부분으로 나누어져 있다고 보면 된다. 2급은 내일배움카드 학습 과정에서 나왔던 기본적인 지식이고, 1급은 기본적인 지식에 스스로 공부를 좀 해야 한다. 검색도 해보고 각각의 단어가 가지고 있는 의미와 전체적인 시스템에서 각 단어들이 가지고 있는 뜻을 알고 있어야 한다. 굳이 나누자면 2급은 작업자의 시각에서, 1급은 검수자의 시각에서 내용을 다룬다.

 

데이터라벨링 AIDE 1,2급 자격증 후기

 

구직 및 데이터 라벨링 작업을 하면서 시험을 봤는데, 2급의 경우 공부한 시간이 무색할 만큼 쉬웠다. 워낙 소심하고 꼼꼼한 성격이라 엉덩이 딱 붙이고 공부했거늘, 그 시간에 데이터 라벨링 작업을 더 했으면 좋았을 정도였다. 1급의 경우, 2급에서 나왔던 내용을 중심으로 인터넷 검색을 통해 스스로 공부를 해야한다. 다만 체계적이지 않고, 영어 축약어가 많은 만큼, 2급과 1급 시험의 텀이 길지 않게 일정을 잡는 걸 추천한다. 인터넷에서 후기와 기출문제들을 검색해 봤는데, 대부분 2급과 1급을 같이 정리해 놨다. (1급 시험 이론편에서는 대부분 찍었...;;;) 시험문제를 봐야, 아 이래서 각 단어들의 뜻을 암기가 아닌 '이해'하고 있어야 한다고 해놨구나하는 생각이 뒤늦게 든다. 실습을 성실히 했다면 실습문제를 잘 맞추는 전략으로 가는게 안전하다.

 

데이터라벨링 AIDE 1급 자격증 기출문제

 

까먹기 전에 개인적으로 궁금한 것들도 있기에 생각나는 대로 메모를 해놓고 검색을 통해 답을 찾아냈다. 머리가 좋지도 않고, 암기에는 꽝인데다가 모르는 단어들이 많아서 보기까지는 기억이 안났다. 다 틀린 것 같다. 이런.

 

1급 시험을 앞두고 한문제라도 아쉬운 분들을 위해 기록을 남긴다. 부디 도움이 되기를...

 

1. GAN을학습할때,가짜이미지와진짜이미지를판단하는것은?

 

① Generator

② InputLayer

③ randomnoise

④ LatentrandomLariable

⑤ Discriminator

정답: ⑤Discriminator

※ 해석

①Generator(생성자):가짜이미지를생성

②InputLayer

③randomnoise

④LatentrandomLariable

⑤Discriminator(판별자):진짜이미지와가짜이미지를구별

GAN(GenerativeAdversarialNetwork)은Generator와Discriminator의경쟁적인학습을통해Data의Distribution을추정하는알고리즘

 

2. CNN(합성곱신경망)알고리즘의converution과정시행렬의크기는?
5x5와필터3x3을넣었다.출력행력의크기는?

이건 인터넷 검색에서도 답을 찾지 못했다. 아시는 분은 답변 좀...

 

3. CNN알고리즘의convolution후,ActivationFunction의함수일때사용하는Activation?

정답:활성함수(Activationfunction)

 

4. 퍼셉트론은 입력값, 가중치, 입력층값, (), 출력값이다.괄호안에알맞은대답은?

 

이것도 인터넷 검색에서도 답을 찾지 못했다. 아시는 분은 답변 좀...

 

5. 인공지능 학습시 알고리즘 상 예측값과 실제값의 차이를 줄이기 위하여 손실함수를 사용한다. 회귀과정에서 사용하는 소실, 손실기의 경사하강법은?

 

정답:LossFunction(손실함수)
반응형