우리는 인공지능에 대해 이야기할 때 종종 그것이 자율적으로 진화하고 스스로 학습하는 것처럼 묘사한다. 챗GPT 같은 언어 모델, 자동 번역 시스템, 이미지 생성 AI, 자율주행 자동차의 똑똑한 판단력까지 모든 것은 마치 인간이 손을 대지 않아도 저절로 가능해지는 것처럼 느껴진다. 하지만 이 모든 시스템의 작동 뒤편에는 사람이 일하고 있다. 그것도 우리가 잘 보지 못하는 곳, 이야기되지 않는 형태의 노동으로 존재하는 AI 뒤의 노동자들이 있다.
알고리즘이 점점 더 정교해지고 있다는 사실은 역설적으로, 그 알고리즘을 위해 더 많은 인간이 더 오래, 더 미세하게 일하고 있다는 뜻이기도 하다. 기계가 세계를 인식하고 판단하며 말할 수 있으려면, 누군가가 먼저 수천, 수만 장의 이미지에 꼼꼼하게 이름을 붙여주어야 하며, 문장의 문맥을 사람이 먼저 이해하고 오류를 교정해야 한다. 데이터는 하늘에서 떨어지지 않는다. 데이터는 인간이 만든다. 이 글에서는 인공지능이라는 화려한 기술의 이면에서 묵묵히 일하는 노동자들에 대해 살펴본다.
AI는 누가 어떻게 키우고 있는지 그들은 어떤 환경에서 일하고 있으며, 그 노동은 왜 쉽게 지워지는지를 살펴보려고 하는 것이다.
기술의 진보가 인간 노동을 대체한다는 서사는 아직 완성되지 않았다. 오히려 지금 이 순간에도, 기술을 지탱하는 무수한 손이 기계의 뒤에 존재하고 있다.
1. AI 학습의 밑거름: 라벨링과 데이터 청소의 세계
인공지능이 세상을 이해하기 위해서는 엄청난 양의 학습 데이터가 필요하다. 그러나 이 데이터가 유의미한 학습이 되기 위해서는 정답을 알려주는 작업, 즉 라벨링이 반드시 필요하다. 예를 들어, 고양이를 인식하는 AI가 고양이를 알기 위해서는 수많은 고양이 사진과 함께, 이것이 고양이다라는 태그가 붙어 있어야 한다. 이 작업은 자동화된 프로그램이 아니라 사람의 손으로 하나하나 이루어진다.
이러한 데이터를 만드는 사람들은 대부분 클릭 노동자라 불린다. 그들은 인터넷을 통해 수주된 단위 작업을 수행하며, 사진 속 물체에 사각형을 그려 넣고, 텍스트 문서의 문맥을 교정하고, 문장에 감정을 표시하고, 단어의 뜻을 분류한다.
이런 작업은 매우 단순해 보이지만, AI에게는 학습의 기초가 되는 정확하고 정제된 정보다.
이들이 데이터를 얼마나 섬세하게 정리하느냐에 따라, 알고리즘의 성능이 결정된다.
그런데도 이들은 거의 항상 이름 없는 존재로 남는것이다. 크라우드웍스 같은 플랫폼을 통해 수많은 노동자가 매일 수천 건의 작업을 처리하지만, 작업 하나당 받는 비용은 몇 원에서 몇십 원 수준이다. 플랫폼은 일의 단위를 잘게 쪼개고 익명화함으로써 노동자의 존재를 최소화한다. 실제로 데이터 라벨링 산업은 세계적으로 디지털 하청 구조로 운영된다.
선진국의 기술 기업이 개발한 알고리즘을 위해, 개발도상국의 노동자들이 낮은 임금과 불안정한 고용 환경 속에서 데이터를 가공하는 식이다. 기계가 점점 더 똑똑해지는 그 순간, 누군가는 보이지 않는 곳에서 클릭하고, 조정하고, 반복하며 AI의 손과 눈이 되어주고 있다.
2. 알고리즘의 윤리를 감시하는 사람들 콘텐츠 필터링의 감정 노동
AI는 단지 고양이와 개를 구분하거나, 문장을 번역하는 일만 하지 않는다. 뉴스 추천, SNS 콘텐츠 정렬, 검색어 자동 완성 등 인간의 감정과 가치에 민감하게 반응해야 하는 작업에도 AI는 활발히 활용된다. 하지만 기계는 윤리를 이해하지 못한다. 그렇기에 이 영역에서도 인간의 개입은 필수적이다. 특히 SNS나 동영상 플랫폼에서는 매일 수많은 폭력적, 선정적, 혐오적 콘텐츠가 업로드된다.
이를 걸러내고, AI가 학습하지 않도록 정화하는 작업은 모두 사람이 한다.
콘텐츠 모더레이터라고 불리는 이 노동자들은 플랫폼이 운영되는 한없이 넓은 바다의 쓰레기를 수작업으로 건져낸다.
그들이 하는 일은 아동 학대나 자해 장면이 담긴 영상 삭제하거나 혐오 발언이 포함된 댓글 필터링을 하거나범죄 장면이 담긴 이미지 분류하고 혐오적 혹은 폭력적인 텍스트에 라벨링 부여하는 것이다. 이 노동은 정신적인 소모가 매우 크다.
지속적으로 극단적인 장면을 목격하면서도 냉정하게 판단을 내려야 하고, 감정을 억누르면서도 기계처럼 정확해야 한다.
일부 모더레이터는 외상 후 스트레스 장애를 겪기도 하며, 몇몇 기업에서는 상담 프로그램을 제공하지만 여전히 이 노동의 심리적 대가는 무시되고 있다. 이러한 작업은 종종 필리핀, 인도, 케냐 등지의 외주 업체를 통해 이루어진다.
즉, 윤리와 정서라는 인간 고유의 판단을 요구하는 영역조차도 전 세계적으로 가장 낮은 임금의 노동자들에게 맡겨지고 있는 현실이다. 우리가 AI는 혐오를 구별할 줄 안다고 말할 수 있는 이유는, 누군가가 미리 그 혐오를 견뎌냈기 때문이다.
3. 우리는 누구를 위해 일하고 있는가: 인간과 기계의 새로운 역학
기계는 인간의 일을 대체할 것이라는 말은 기술 발전과 함께 반복되어온 담론이다.
하지만 오늘날 우리가 마주하는 현실은 조금 다르다. 기계는 인간의 일을 완전히 대체하지 못했으며, 오히려 인간은 기계를 훈련시키는 노동자가 되고 있다. 우리는 매일 알고리즘을 위해 정보를 제공하고 있다.
유튜브에서 좋아요를 누르고, 인스타그램에서 게시물을 스크롤하고, 검색어를 입력하고, 댓글을 다는 모든 행위는 AI의 학습 재료가 된다. 우리가 무심코 하는 클릭 하나, 선택 하나가 AI를 더 똑똑하게 만든다.
이러한 데이터는 종종 무급이며, 플랫폼은 사용자로부터 이를 자연스럽게 수집한다. 뿐만 아니라, 이제 전문 직종조차 AI 보조를 위한 인간 노동으로 이동하고 있다.
의사는 AI 진단을 위한 데이터를 정제하거나 기자는 AI가 쉽게 분류할 수 있도록 기사를 구조화하던지 교사는 AI 튜터링 시스템을 위한 질문과 답변을 설계하는 것이다. 인간은 점점 더 기계가 이해할 수 있도록 자신의 사고와 표현을 기계 친화적으로 바꾸고 있다.
이는 단순한 기술 적응이 아니라, 노동의 방향 자체가 기계를 중심으로 재편되고 있음을 의미한다.
AI는 더 이상 미래의 기술이 아니다. 우리 삶의 중심에서 이미 다양한 방식으로 기능하고 있으며, 우리는 그 결과를 매일 소비하고 있다. 하지만 그 이면에는 묵묵히 데이터를 정리하고, 윤리를 심고, 감정을 조율하는 사람들이 존재한다. 그들의 노동은 기술의 화려한 겉모습에 비해 조명되지 않고, 평가절하되며, 때로는 완전히 지워진다. 우리 모두가 이미 알고있듯이 인공지능은 스스로 성장하지 않는다. 우리가 흔히 AI가 스스로 학습했다고 말할 때, 그 학습은 누군가의 수많은 클릭, 판단, 감정, 시간이 축적된 결과다.
기술의 진보는 인간 노동의 재구성 없이는 불가능하다. 그렇기때문에 우리는 지금 AI를 키우는 사람들에 대해 꾸준히 생각해봐야한다. 그들의 이름이 기술의 역사에서 사라지지 않고 기계가 지능을 갖추기 전 인간이 먼저 그 지능을 가르쳤다는 사실을 기억해야하기 때문이다.