wai-kor 기술 뒤에 담긴
에이트테크의 관점을
wai-kor 기술 뒤에 담긴
에이트테크의 관점을
기술을 만든 사람들과
함께 이야기합니다.
기술을 만든 사람들과
함께 이야기합니다.
TECH BEHIND
TECH BEHIND
for wai-kor
for wai-kor
wai-kor는 가장 한국적인 폐기물 선별 AI 알고리즘입니다. 높은 선별 정확도의 기반에는 wai-kor가 있습니다.
wai-kor는 가장 한국적인 폐기물 선별 AI 알고리즘입니다. 높은 선별 정확도의 기반에는 wai-kor가 있습니다.
또한 wai-kor의 제작 경험은 해외의 다른 지역을 빠르게 이해하고 그 지역에 적합한 데이터를 만드는데 소중한 자산이 됩니다.
또한 wai-kor의 제작 경험은 해외의 다른 지역을 빠르게 이해하고 그 지역에 적합한 데이터를 만드는데 소중한 자산이 됩니다.
이 기술 뒤에 담긴 에이트테크의 관점을 기술을 만들어 가는 사람들의 이야기를 통해 전달합니다.
이 기술 뒤에 담긴 에이트테크의 관점을 기술을 만들어 가는 사람들의 이야기를 통해 전달합니다.
일단 결론부터
로컬을 이해하는
AI 폐기물 알고리즘이 가능한 이유
로컬을 이해하는
AI 폐기물 알고리즘이
가능한 이유
내재화된 {데이터팀}
내재화된 {데이터팀}
일관적인
데이터 품질(DQC)을
만들기 위한 노력
일관적인
데이터 품질(DQC)을
만들기 위한 노력
Who's Behind Today?
Who's Behind Today?
이도경 이사
CTO
윤민선 선임
데이터 분석 파트
가장 한국적인 AI의 비밀 #1
{데이터팀}의 내재화
{데이터팀}의 내재화
"실제 데이터보다 효과적인 것은 없습니다"
"실제 데이터보다
효과적인 것은 없습니다"
이도경 이사
이도경 이사
와이코어의 강점은 데이터 팀의 내재화입니다. 폐기물 특성에 맞게 라벨링 할 수 있는 시스템. 에이트테크에 합류하면서 가장 먼저 했던 일이었어요.
와이코어의 강점은 데이터 팀의 내재화입니다. 폐기물 특성에 맞게 라벨링 할 수 있는 시스템. 에이트테크에 합류하면서 가장 먼저 했던 일이었어요.
AI 모델은 계속 발전합니다. 하지만 동시에 양질의 데이터가 필요해요. 특히나 새롭게 겪는 상황을 어떻게 데이터화 시키느냐고 중요하죠.
AI 모델은 계속 발전합니다. 하지만 동시에 양질의 데이터가 필요해요. 특히나 새롭게 겪는 상황을 어떻게 데이터화 시키느냐고 중요하죠.
예를 들어 이물질 위에 페트병이 얹혀져 있다면 인식 정확도가 많이 저하됩니다. 페트병이 아닌 객체로 인식할수도 있고 배경으로 인식하여 검출이 안될 수도 있죠.
예를 들어 이물질 위에 페트병이 얹혀져 있다면 인식 정확도가 많이 저하됩니다. 페트병이 아닌 객체로 인식할수도 있고 배경으로 인식하여 검출이 안될 수도 있죠.
이러한 이슈를 빠르게 파악하고 데이터를 수집하여 라벨링 작업을 진행해야합니다. 이 과정에서 AI를 사용한 오토라벨링 기술을 사용하기도 하지만, 결국 사람의 눈을 통한 리뷰를 거쳐야 합니다.
이러한 이슈를 빠르게 파악하고 데이터를 수집하여 라벨링 작업을 진행해야합니다. 이 과정에서 AI를 사용한 오토라벨링 기술을 사용하기도 하지만, 결국 사람의 눈을 통한 리뷰를 거쳐야 합니다.
에이트테크는 자체 데이터팀이 존재하여 문제 해결 능력이 우수하고, AI 개발 자유도가 높다고 할 수 있습니다.
에이트테크는 자체 데이터팀이 존재하여 문제 해결 능력이 우수하고, AI 개발 자유도가 높다고 할 수 있습니다.
로컬을 가장 잘 이해하는 데이터
로컬을
가장 잘 이해하는 데이터
윤민선 선임
윤민선 선임
보통의 경우 오픈된 데이터 셋을 사용하는 경우가 많아요. 아무래도 가장 손쉽게 접근할 수 있으니까요. 하지만 외국에서 만들어진 경우가 많기 때문에 한국에서 바로 사용하기에는 무리가 있습니다.
보통의 경우 오픈된 데이터 셋을 사용하는 경우가 많아요. 아무래도 가장 손쉽게 접근할 수 있으니까요. 하지만 외국에서 만들어진 경우가 많기 때문에 한국에서 바로 사용하기에는 무리가 있습니다.
데이터 팀의 내재화는 스타트업에게는 부담일 수는 있어요. 결국 비용 문제니까요.
데이터 팀의 내재화는 스타트업에게는 부담일 수는 있어요. 결국 비용 문제니까요.
하지만 한국에만 있는 한국적인 용기들이 정말 많아요. 예를 들어 콜라병이나 사이다병들도 한국에서만 사용하는 모양들이 있어요. 그럴 경우 외국에서 만들어진 데이터셋은 활용하기가 쉽지 않아요.
하지만 한국에만 있는 한국적인 용기들이 정말 많아요. 예를 들어 콜라병이나 사이다병들도 한국에서만 사용하는 모양들이 있어요. 그럴 경우 외국에서 만들어진 데이터셋은 활용하기가 쉽지 않아요.
저희는 이런 한국적인 환경을 가장 잘 이해하고 데이터를 라벨링하여 활용하기 위한 시스템을 구축했어요. 데이터팀의 내재화는 우리만의 확실한 강점이라고 생각합니다.
저희는 이런 한국적인 환경을 가장 잘 이해하고 데이터를 라벨링하여 활용하기 위한 시스템을 구축했어요. 데이터팀의 내재화는 우리만의 확실한 강점이라고 생각합니다.
포인트 #1
포인트 #1
실제 가장 한국적인 데이터의 수집 및 분석을 위한 데이터 팀의 내재화 → 가장 한국적인 AI 폐기물 알고리즘의 비밀
실제 가장 한국적인 데이터의 수집 및 분석을 위한 데이터 팀의 내재화 → 가장 한국적인 AI 폐기물 알고리즘의 비밀
가장 한국적인 AI의 비밀 #2
가장 한국적인 AI의 비밀 #2
일관적인 DQC를 위한 노력
일관적인
DQC를 위한 노력
DQC: Data Quality Control
마치 한 사람이 라벨링한 것처럼
마치 한 사람이
라벨링한 것처럼
윤민선 선임
윤민선 선임
저희의 가장 중요한 목표는 누가 작업을 하든 마치 한 사람이 라벨링 한 것처럼 일관된 결과물이 나오게 만드는 것이에요.
저희의 가장 중요한 목표는 누가 작업을 하든 마치 한 사람이 라벨링 한 것처럼 일관된 결과물이 나오게 만드는 것이에요.
아무래도 여러 명이 작업을 하다보니 같은 객체를 다르게 라벨링 할 수도 있으니까요. 그럴 경우 일정한 데이터 품질(DQC)에 영향을 미칠 수 있기 때문에 일관된 데이터 라벨링 작업이 무엇보다 중요합니다.
아무래도 여러 명이 작업을 하다보니 같은 객체를 다르게 라벨링 할 수도 있으니까요. 그럴 경우 일정한 데이터 품질(DQC)에 영향을 미칠 수 있기 때문에 일관된 데이터 라벨링 작업이 무엇보다 중요합니다.
그래서 라벨링 작업 시 자세한 내용과 기준이 담긴 가이드를 중요하게 생각하고 있어요. 누군가 24시간 계속 붙어서 교육을 하거나 코치를 해줄 수는 없으니까요.
그래서 라벨링 작업 시 자세한 내용과 기준이 담긴 가이드를 중요하게 생각하고 있어요. 누군가 24시간 계속 붙어서 교육을 하거나 코치를 해줄 수는 없으니까요.
스스로 참고하여 결정하되 그 결과물이 일정할 수 있도록 명확함을 중점에 두고 가이드를 만들고 있습니다.
스스로 참고하여 결정하되 그 결과물이 일정할 수 있도록 명확함을 중점에 두고 가이드를 만들고 있습니다.
목표: 온보딩 기간 단축 (2개월 -> 1개월)
목표
: 온보딩 기간 단축
(2개월 -> 1개월)
윤민선 선임
윤민선 선임
저희는 사업이 성장하면서 새로운 라벨러 분들의 합류가 많은 편이에요.
저희는 사업이 성장하면서 새로운 라벨러 분들의 합류가 많은 편이에요.
그럴 경우 일정한 수준의 결과를 보여줄 때까지 보통 2개월이 걸립니다. 교육과 작업이 병행해서 진행되는데요, 이 때 좋은 교육이 이루어지지 않으면 시간은 더 길어지게 됩니다.
그럴 경우 일정한 수준의 결과를 보여줄 때까지 보통 2개월이 걸립니다. 교육과 작업이 병행해서 진행되는데요, 이 때 좋은 교육이 이루어지지 않으면 시간은 더 길어지게 됩니다.
그래서 저희가 쌓은 경험을 바탕으로 새로운 신규 라벨러 교육 시스템을 준비하고 있어요.
그래서 저희가 쌓은 경험을 바탕으로 새로운 신규 라벨러 교육 시스템을 준비하고 있어요.
기초적인 분류 방법에 더해 자주 틀리는 사례들을 모아서 실패에 대한 효과적인 간접 경험을 제공하는 것이 목표입니다.
기초적인 분류 방법에 더해 자주 틀리는 사례들을 모아서 실패에 대한 효과적인 간접 경험을 제공하는 것이 목표입니다.
새로운 사례로 인한 실패가 아니라 반복되는 기존 사례로 인한 실패만 줄여도 교육기간이 많이 감소 될 테니까요.
새로운 사례로 인한 실패가 아니라 반복되는 기존 사례로 인한 실패만 줄여도 교육기간이 많이 감소 될 테니까요.
만약 준비중인 교육 시스템이 효과적으로 자리잡는다면 교육기간은 2개월에서 약 1개월로 단축을 예상하고 있습니다.
만약 준비중인 교육 시스템이 효과적으로 자리잡는다면 교육기간은 2개월에서 약 1개월로 단축을 예상하고 있습니다.
포인트 #2
포인트 #2
한사람이 라벨링한 듯 일관적 결과물을 위한 환경 구축과 새로 합류한 인원들의 적응 기간을 절반으로 줄이는 교육 시스템 → 일관적인 DQC의 비밀
한사람이 라벨링한 듯 일관적 결과물을 위한 환경 구축과 새로 합류한 인원들의 적응 기간을 절반으로 줄이는 교육 시스템 → 일관적인 DQC의 비밀
wai-kor의 경험을 기반으로 세계를 향해
wai-kor의 경험을 기반으로 세계를 향해
이도경 이사
이도경 이사
해외 역시 각 지역별 특성을 지니는 폐기물들이 존재합니다. 그럴 경우 오픈 데이터만으로는 그 지역을 이해하는데 한계가 있어요. 그 지역에서 직접 데이터를 모으고 분석할 수 있는 데이터 팀이 필요하죠.
해외 역시 각 지역별 특성을 지니는 폐기물들이 존재합니다. 그럴 경우 오픈 데이터만으로는 그 지역을 이해하는데 한계가 있어요. 그 지역에서 직접 데이터를 모으고 분석할 수 있는 데이터 팀이 필요하죠.
그리고 지역 특성을 이해하는 데이터 셋의 구축은 반드시 선행 경험이 필요해요. 선행 경험이 없으면 더 많은 시행착오를 겪어야 하고, 시간과 비용을 더 많이 소요할 수 있거든요.
그리고 지역 특성을 이해하는 데이터 셋의 구축은 반드시 선행 경험이 필요해요. 선행 경험이 없으면 더 많은 시행착오를 겪어야 하고, 시간과 비용을 더 많이 소요할 수 있거든요.
그리고 이 지점이 에이트테크가 가진 기술의 강점입니다. 가장 한국적인 폐기물 데이트를 만들고 쌓은 과정에서 얻은 프로세스, 경험, 노하우는 단순히 한국에만 국한되지 않습니다.
그리고 이 지점이 에이트테크가 가진 기술의 강점입니다. 가장 한국적인 폐기물 데이트를 만들고 쌓은 과정에서 얻은 프로세스, 경험, 노하우는 단순히 한국에만 국한되지 않습니다.
해외 진출 시 그 지역을 파악하는데 wai-kor를 만든 경험은 분명 중요한 자산이 될거에요. 그래서 시행착오를 최소화하고 해당 지역을 이해하는 데이터 셋을 빠르게 구축할 수 있죠.
해외 진출 시 그 지역을 파악하는데 wai-kor를 만든 경험은 분명 중요한 자산이 될거에요. 그래서 시행착오를 최소화하고 해당 지역을 이해하는 데이터 셋을 빠르게 구축할 수 있죠.
wai-kor를 만들면서 고민한 흔적들은 에이트테크가 세계의 더 많은 곳에서 활약할 수 있는 든든한 기반이 되어줄 것으로 생각합니다.
wai-kor를 만들면서 고민한 흔적들은 에이트테크가 세계의 더 많은 곳에서 활약할 수 있는 든든한 기반이 되어줄 것으로 생각합니다.
포인트 #3
포인트 #3
wai-kor를 만들면서 고민한 흔적들 -> 해외 로컬들을 깊게 이해하고 빠르게 데이터 셋을 구축 할 수 있는 든든한 자산
wai-kor를 만들면서 고민한 흔적들 -> 해외 로컬들을 깊게 이해하고 빠르게 데이터 셋을 구축 할 수 있는 든든한 자산
에이트테크는 더 나은 선별을 위해 지역의 폐기물을 고민합니다. 그리고 이 과정에서 얻은 경험들이 한국을 비롯한 더 넓은 세계에서 그 지역을 이해하고 더 나은 환경을 만드는 든든한 자산이 되어주고 있습니다.
에이트테크는 더 나은 선별을 위해 지역의 폐기물을 고민합니다. 그리고 이 과정에서 얻은 경험들이 한국을 비롯한 더 넓은 세계에서 그 지역을 이해하고 더 나은 환경을 만드는 든든한 자산이 되어주고 있습니다.