Data-Centric AI 란
- AI 성능을 개선하는 데 있어 데이터의 품질과 준비에 초점을 맞춘 접근 방식
- 좋은 데이터를 어떻게 구축하고 관리할지에 집중
Data-Centric AI vs. Model-Centric AI
- Model-Centric AI: 모델 아키텍처나 하이퍼파라미터 튜닝 등 모델을 개선하는 것에 집중하여 데이터는 고정된 상태에서 모델의 성능을 최대화
- Data-Centric AI: 모델이 아닌 데이터의 품질을 향상시켜 AI 시스템을 개선하는 접근 방식으로 잘못된 레이블 수정, 데이터 증강, 다양한 데이터를 추가하는 방식으로 성능을 높이며 모델이 동일한 상태일 때, 데이터의 품질이 성능에 중요한 영향을 미친다는 점을 강조
Data-Centric AI Manager vs. Data Manager
- Data-Centric AI Manager
- AI 개발 과정에서 데이터를 전략적으로 다루는 역할 수행
- 단순한 데이터 관리가 아니라, AI 모델의 성능 향상을 위해 데이터의 품질, 다양성, 레이블링 전략 등을 계획하고 실행
- AI 성능 개선을 위해 데이터를 지속적으로 분석하고 수정하는 작업을 수행
- Data Manager
- 일반적으로 데이터의 저장, 보안, 접근 권한 관리 등 데이터 관리의 기본적인 측면을 담당하는 역할
- 주로 데이터베이스, 데이터 웨어하우스 관리에 집중하며, AI 모델의 성능 개선보다는 데이터의 보존과 전달에 더 중점을 둠
Data-Centric AI는 특히 대량의 데이터에서 모델을 더 효율적으로 훈련시키고 싶을 때, 모델 튜닝 대신 데이터 개선을 통해 성능을 극대화하는 방식으로 큰 효과를 발휘!
'Upstage AI Lab 3기' 카테고리의 다른 글
Upstage AI Lab 3기 수료 후기 (1) | 2024.11.08 |
---|---|
현직자 취업특강 회고 (2) | 2024.11.07 |
NLP(Natural Language Processing) (1) | 2024.09.23 |
Computer Vision Basic, Advanced, Generation (0) | 2024.08.20 |
Image Classification 경진대회 최종 4등 (0) | 2024.08.12 |