DataRobot은 데이터 분석 모델링의 전체 과정에서 유용한 기능을 제공하나요?
DataRobot은 데이터 수집, 전처리, 모델링, 모델 배포 및 운영에 이르기까지 데이터 분석 모델링 전체에 대해 End-to-end 기능을 제공하는 플랫폼입니다. DataRobot은 총 4개 모듈로 구성되어 있습니다. DataPrep 모듈에서는 데이터 수집과 전처리에 강력한 기능을 제공하고 있고, AutoML 모듈에서는 자동화된 Feature Engineering, 모델 학습, 모델 검증 및 평가, 시각화 등 모델링과 관련한 많은 자동화 기능들을 제공하고 있습니다. AutoTS 모듈에서는 시계열 모델링을 자동화 하며, MLOps 모듈을 통해 배포 관리, 모델 모니터링, 모델 재학습 등을 손쉽게 실행할 수 있습니다.
DataRobot의 기능들은 Web UI를 통해서만 사용할 수 있나요?
Web UI를 통해 사용하는 모든 기능들은 API를 통해서도 제공되고 있습니다. 사용자는 API 연결을 위해 Python 또는 R 등의 언어를 사용할 수 있습니다.
AutoML(AutoTS)로 만들어진 모델의 구조를 사용자가 확인할 수 있나요?
사용자는 모델 블루프린트 기능을 사용해 모델 구조를 도식화된 형태로 확인이 가능합니다. 모델 블루프린트에서는 사용 알고리즘, 하이퍼퍼라미터 값 등을 확인할 수 있으며, 경우에 따라 모델 블루프린트 편집 기능을 사용해 커스텀 모델을 구성할 수도 있습니다.
모델링에 사용하는 알고리즘의 종류는 무엇이 있나요?
sckit-learn, tensorflow 등 ML/DL 라이브러리에서 제공하는 대부분의 모델을 포함하여, DataRobot의 Grand-master 데이터 과학자의 노하우가 담긴 독자적인 모델을 수천 여개 제공하고 있으며, 최신 알고리즘이 활발하게 업데이트 되고 있습니다.
비정형 데이터를 사용한 모델링이 가능한가요?
DataRobot에서는 텍스트 또는 이미지 데이터를 사용한 기본적인 모델링을 지원하고 있습니다. 텍스트 데이터에 대해서는 텍스트를 벡터화시키는 Featurization(N-gram, TF-IDF, Word2Vec, Fasttext, TinyBert와 같은 텍스트 임베딩 기법 사용)을 지원하고 있어, 이를 사용하여 텍스트 Feature를 사용한 모델링을 실행할 수 있습니다.
또한 이미지 분류 문제 등을 풀기 위한 여러가지 알고리즘들을 제공하고 있어, 이를 사용하여 사용자가 이미지 형태의 Target 또는 Feature를 대상으로 모델링을 실행할 수 있습니다.
모델 재학습 시점을 포착하여, 자동으로 모델 재학습을 실행하는 기능을 제공하고 있나요?
MLOps 모듈에서는 Continuous AI를 위한 자동 재학습 트리거 설정 기능을 제공하고 있습니다. Time Schedule 설정, Data Drift 포착, Accuracy 성능 이상 감지 등을 트리거로 자동 재학습이 가능합니다.
Explainable AI 관련된 기능을 제공하나요?
SHAP, XEMP 방법론을 포함한 Prediction Explanations 기능을 제공 합니다. DataRobot에서는 이외에도 모델 구조 이해를 위한 모델 블루프린트, Target에 대한 각 Feature 영향도를 확인하는 Feature Impact, 각 Feature의 변화에 따른 예측 변화를 확인하기 위한 Feature Effect 등의 다양한 시각화 자료를 제공하여, 사용자가 모델에 대해 높은 이해를 할 수 있도록 돕습니다.
DataRobot 활용도를 높이기 위한 사용자 교육을 제공하고 있나요?
SK는 DataRobot 도입 기업의 솔루션 활용 역량을 높이기 위해 전문강사의 On/Offline 교육 프로그램을 제공하고 있습니다. 또한 사용자는 DRU(DataRobot University)를 통해 데이터 분석 기초지식, 데이터로봇의 전반적인 사용법, 응용분석 방법 등에 대한 교육을 무료로 수강할 수 있습니다. 또한 고급사용자를 위한 심화과정 또한 (유료) 제공되고 있어, 목적에 맞는 다양한 교육 프로그램을 활용하여 사용자의 역량을 높일 수 있습니다.