본문 바로가기

Data Analysis/RapidMiner7

[Altair 래피드마이너 서포터즈] 7회차 활동 1. Applying the Model 먼저 , 분석하고자 하는 데이터 셋을 불러와준다. 데이터를 불러와줄 때, 예측하고 싶은 열을 label로 지정해준다. label로 지정해주면 다음과 같이 색이 다르게 보여진다. 예측하고자 하는 열이 Churn인데, 여기서 missing value가 보여진다. (96개) 이를 제거해주기 위해서 filter examples 오피레이터를 이용해서 해당 열을 is not missing으로 설정해준다. 그럼, 다음과 같이 결측치가 사라진 것을 확인할 수 있다. 그런 다음, Decision Tree 모델을 설정해주고, 앞서 해준 filter examples를 한번 더 해준다. 다음, apply model을 지정해주는데, 여기서 mod이라고 적힌 곳에 사용하고자 하는 모델인 D.. 2023. 6. 11.
[Altair 래피드마이너 서포터즈] 6회차 활동 이번 활동은 저번활동에 이어서 래피드마이너 실습과 Data Preparation & Enginnering의 certification 취득에 도전하였다! 1. 래피드마이너 실습 4회차 활동에 이어서 Get Started with Rapidminer & Machine Learning 챕터에 들어가서 Connecting to Database 부터 학습을 진행하였다 1. Connecting to Database 이번 챕터의 주된 내용은 데이터 베이스를 래피드마이너에 연결시키는 것이었다. '데이터베이스에 연결하는 방법'에 대해서 먼저 데이터베이스 연결 설정을 검토한 다음, 자신을 위해 또는 다른 사람이 사용할 연결 템플릿을 만드는 방법을 보여줍니다. 또한, Postgres 데이터베이스를 사용하는 관계형 데이터베이.. 2023. 5. 14.
[Altair 래피드마이너 서포터즈] 5회차 활동 이번 포스팅에서는 래피드마이너 자격증과 관련된 정보와 시험에 관해 설명해보고자 한다. 시험은 Altair Academy 홈페이지에서 치르고, 자격증을 취득할 수 있는데, 아래의 홈페이지로 들어가면 된다. https://academy.rapidminer.com/ Machine Learning and RapidMiner Tutorials | RapidMiner Academy Content Library All Courses, Paths and Micro-Learning elements academy.rapidminer.com 로그인을 진행하고 홈페이지 상단에 있는 MY DASHBOARD에 들어간다. MY DASHBOARD에 들어가게 되면, 6개 파트로 구성되어져 있는 것을 볼 수 있다. 밑에 그림을 참고해봤.. 2023. 5. 4.
[Altair 래피드마이너 서포터즈] 4회차 활동 지난 활동에 이어서 이번 활동은 아래와 같은 순서로 진행한다. 1. Turbo Prep - Merging Data 두 개의 데이터 셋을 하나로 병합하는 방법을 설명하고, 데이터가 일치하지 않는 경우 어떤식으로 처리해야 하는지 소개한다. 데이터 불러오기 1) Titanic Training 데이터 셋과 Titanic Unlabeled 데이터 셋 Titanic Training Titanic Unlabeled ▶ 합쳐주고 싶은 데이터는 titaninc training 데이터와 titanic unlabeled 데이터이다. 래피드마이너를 이용하여 두 데이터 셋을 불러와주었을 때, 위의 사진과 같이 Titaninc Unlabeled 데이터셋에 Survived 열이 없음을 알 수 있다. ▶ 따라서, survived 열.. 2023. 4. 16.
[Alter 래피드마이너 서포터즈] 3회차 활동 2회차 활동에 이어서 3회차 활동을 진행하였다. 래피드마이너 홈페이지에 접속하여 다음 영상부터 self-study를 진행하였다. 1. Turbo Prep - Introduction 래피드마이너 기능 중 하나에 해당하는 Trubo Prep을 진행하기 위해서 들어갔는데, 무료버전에는 turbo prep 기능을 사용할 수 없다고 떴다.. 찾아보니, 유료, 교육용 또는 평가판 Rapid Miner를 사용하면 Turbo Prep을 사용할 수 있었다. Turbo Prep 기능은 단계별 프로세스를 직접 생성할 필요 없이 가이드 방식으로 데이터 준비를 시작할 수 있는 좋은 방법이다. Turbo prep을 사용하면 각 준비 단계 후 데이터가 어떻게 보이는지 확인할 수 있으며 필요한 경우 차트에서 즉석에서 분석하거나 품질.. 2023. 3. 28.
[Alter 래피드마이너 서포터즈] 2회차 활동 지난 포스팅에 이이서 래피드마이너 2회차 활동을 시작하였다. 매달 2번씩 self-study를 진행해야 하는데 3월은 10일과 24일날 자신이 해온 것을 업로드 해야 한다. 1회차 활동을 진행할 때, 막상 혼자 공부하려고 하니까 뭔가 계획적이게 공부하지 못한 것이 아쉬웠다. 그래서 이번 주차 부터는 계획을 세우고 진행하려고 한다. 먼저, rapidminer academy 사이트에 접속했다. https://academy.rapidminer.com/ Machine Learning and RapidMiner Tutorials | RapidMiner Academy Content Library All Courses, Paths and Micro-Learning elements academy.rapidminer.c.. 2023. 3. 10.