#7 Suite로 데이터 관리하기📈
안녕하세요🙂 오토라벨링(Auto-Labeling)이라는 로켓을 통해 효율적인 라벨링이 가능한 Suite! 이번에는 또 다른 강점인 대규모 머신러닝 데이터셋 구축 시 필수적인 체계적인 데이터 관리에 대해 알려드릴 텐데요.
이를 도와줄 여러분의 파트너, 태그(Tag)와 필터(Filter), 검색(Search) 기능을 소개합니다!

태그와 필터, 검색이 필요한 이유

대규모 머신러닝 데이터셋을 구축하는 경우, 데이터를 체계적으로 관리할 수 없다는 것이 가장 큰 문제점입니다. 프로젝트를 진행하다 보면 라벨링 작업 이후 다시 데이터를 찾아야 하거나 특정 문자열을 포함한 라벨만 확인해야 하는 경우가 많습니다.
이런 경우 태그와 필터, 그리고 검색 기능이 그 힘을 발휘하게 됩니다. 작업 이후에 다시 원하는 데이터를 찾기 용이하도록 라벨에 메모를 남길 수 있고, 특정 조건에 맞는 라벨을 따로 분류하고 검색하여 불러올 수도 있기 때문이죠. 보다 자세한 활용 방법은 아래 링크에서 확인해 주세요 😄

태그 생성 방법

1. Project List → 프로젝트 선택 → Label List에서 태그를 생성할 라벨을 선택한 후 우측 상단의 'Edit Tags' 버튼을 눌러주세요. 상세보기 페이지의 우측 Label Information에서도 버튼을 눌러 수정할 수 있습니다.
2. Edit Tags 버튼을 클릭하면 현재 존재하는 태그 목록과 태그들의 라벨 적용 여부를 보여줍니다. 태그 옆 체크 박스의 의미는 다음과 같습니다.
  • □ (체크 박스가 비어있는 경우): 선택된 라벨 중 해당 태그가 적용된 라벨 없음
  • ☑ (체크 박스가 선택되어 있는 경우): 선택된 모든 라벨에 해당 태그가 적용되어 있음
  • [-] (체크박스에 하이픈이 표시된 경우): 선택된 라벨 중 일부에만 해당 태그가 적용됨
선택한 라벨에 기존에 존재하는 태그를 적용할지, 새로운 태그를 만들어 적용할지 선택할 수 있습니다. 새로운 태그를 만들 경우, 입력란에 키워드를 입력한 후 엔터 키를 눌러주세요.

라벨 필터 (Label Filter)

Label List 페이지에서 다양한 필터를 적용하여 원하는 조건에 맞는 라벨을 필터링하세요.
  • Label Tag Filter
    라벨 태그 별로 라벨을 필터링 할 수 있는 기능
  • Annotation Filter
    라벨에 적용된 어노테이션(예 : 오브젝트 클래스, 카테고리 등)별로 라벨을 필터링 할 수 있는 기능
  • Status Filter
    라벨 상태 별로 라벨을 필터링 할 수 있는 기능. (추가 정보는 라벨은 무엇인가요? 참조)
  • Date Added Filter
    원본 데이터(raw data)가 해당 프로젝트에 추가된 날짜 별로 라벨을 필터링 할 수 있는 기능
  • Last Updated Filter
    특정 날짜 혹은 특정 기간 동안 업데이트 된 라벨을 필터링 할 수 있는 기능으로, 어노테이션, 상태 변경, 태그 지정, Assignee 지정 등 라벨에 변경사항이 있을 경우 업데이트로 간주됨
  • Assignee Filter
    라벨 작업을 배정받은 유저의 이름을 기준으로 라벨을 필터링 할 수 있는 기능
  • Open Issues Filter
    아직 해결되지 않은 이슈 스레드가 있는 라벨을 필터링 할 수 있는 기능. 유저는 모든 라벨에 이슈 스레드를 만들어 무엇이든 표시할 수 있음(예 : 라벨링 작업이 잘 안 되었을 경우, 매니저가 이슈 스레드를 만들어 작업자에게 알려줌)
  • Dataset Filter
    프로젝트에 여러 데이터셋에서 가져온 원본 데이터가 있는 경우, 데이터셋 필터를 활용하여 특정 데이터셋에 연결된 라벨들만 필터 할 수 있는 기능
  • Pre-label Filter
    오토라벨링(Auto-labeling) 작업 완료 시 표기되는 'Pre-label'을 기준으로 필터링 할 수 있는 기능
  • Auto-label Request
    오토라벨링(Auto-labeling)의 진행 상황을 필터링할 수 있는 기능. 오토라벨이 정상적으로 요청된 경우 'is processing' 필터로 확인할 수 있으며, 요청에 실패한 경우 'has failed' 필터로 확인 가능
  • Label ID
    특정 Label ID를 포함한 라벨을 필터링할 수 있는 기능. Export 후 다운로드 받은 zip 파일에서도 Label ID 확인 가능
라벨은 Label List 페이지 오른쪽 상단에 있는 검색 박스에서 데이터 키(Data key)를 통해 검색할 수 있습니다. 데이터 키는 라벨이 연동 되어있는 원본 데이터 파일명입니다.