| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
- GRU
- 그리드서치
- 교차검증
- 파이썬 머신러닝 완벽 가이드
- 중앙이동알고리즘
- DB 구축
- 프로그래머스
- 진법변환
- 백준
- multihead attention
- DataBase툴
- dbeaver
- 데이터정의어
- LSTM
- 토이프로젝트
- Estimator
- positional encoding
- 별 생성
- nlp
- K-Fold
- GridSearchCV
- rnn
- 패턴찾기
- SQL 코테
- 문자열반복
- 파이썬 머신러닝 완벽가이드
- map() 객체
- QGIS #시각화 #SW
- Bidirectional
- 태블로
- Today
- Total
목록Data Analysis (21)
데이터분석가 | 취준생
클라우드 컴퓨팅 (Cloud Computing)- Digital Transformation의 핵심적인 기술(factor) 중 하나# 4차산업혁명시대의 발발 18C 후반부터 1차산업혁명이 시작되었다. 대량생산을 가능하게 한 증기기관을 기반으로 공장들이 많이 생겨났다. 그 후 전기가 등장하면서 19C 말 2차 산업혁명이 도래되었다. 컨베이어벨트를 통한 대량생산이 가능해졌고, 1969년 최초의 인터넷, ARPA가 처음 만들어지면서 3차 산업혁명 시대로 도달했다. 컴퓨터는 이전에도 나왔지만, 컴퓨터 간의 네트워크가 가능해짐에 따라 3차 산업혁명, 정보화 시대라고 일컫는다. 마침내 4차 산업혁명은 다보스포럼(2012)의 주제로써 독일에서 처음 등장하게 되었다. 인공지능, 빅데이터, 초연결 사회인 4차 산업혁..
대구은행에서 작년 8월부터 진행한 IT's DGB, I'M Challenger에 참여하였다. 프로젝트의 과정은 팀별로 서류심사를 거친 뒤 본선발표를 진행하여 최종 파이널 진출자를 설정한다. 파이널에 참여하게 되면 대구은행에서 제공해주는 전문교육을 수강하고, 내년 5월에 final round를 진행한다. 운 좋게 우리 팀은 최종 파이널에 선정되어 1월 9일부터 약 4주간 DGB에서 제공하는 전문교육을 수강하게 되었다.https://dgb-challenger.co.kr/ DGB금융그룹 – IT's DGB, IM Challenger제2회 대한민국 디지털 인재 양성 프로젝트, 발대식 및 본선대회 안내dgb-challenger.co.kr 첫번째 주차에서 배운 주제는 클라우드와 Linux에 관한 기초 개념과 S..
1. RNN 개념2. 인공신경망 이해3. RNN의 구조4. RNN의 형태5. RNN 수식6. RNN의 장단점 1. RNN 개념RNN(Recurrent Neural Network)는 가장 기본적인 인공신경망 시퀀스(Sequence) 모델이다.Sequence는 '순서'라는 의미인데, 여기에 대입해보면 순서를 기반으로 한 모델이라고 해석할 수 있다.순서를 기반으로한 모델이란, 쉽게 말해서 연속형 데이터, 즉 데이터가 어떤 순서로 오느냐에 따라서 단위의 의미가 달라지는 데이터를(예를 들면, 자연어나 시계열 데이터를 의미한다.) 사용하는 모델이다. 2. 인공신경망 이해RNN의 구현방법을 설명하기 전에, 인공신경망에 대한 기본적인 내용을 설명하겠다.인공신경망(Artificial Neural Network)은 ..
[ Kospi Stock Dashboard ] https://dacon.io/competitions/official/235980/data 월간 데이콘 KOSPI 기반 분석 시각화 경진대회 - DACON분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다.dacon.io dacon에 올라온 데이터 중에서 간단히 만들 수 있는 데이터를 선택했다.데이터에 대해서 간략히 소개하자면, 1981.05.01 부터 2022.08.31 까지의 일별 KOSPI 데이터이고 아래와 같은 열로 구성되어져 있다.Close : 종가Open : 시가High :고가Low : 저가Volume : 거래량Change : 등락률 (전일대비 등락률)등락률 = (현재종가 - 전일 종가) / 전일 종가 - 데이터 전처리..
데이터 분석을 하는 경우, 데이터 전처리 하는 과정에서 개인적으로 가장 어려운 부분이 결측치 처리라고 생각한다.결측치(missing value)는 데이터의 빈 값을 말하며, 이것을 제거하거나 대체해 준 뒤 머신러닝이나 딥러닝을 실행한다. 데이터의 형태는 크게 범주형 데이터와 수치형 데이터로 나뉘는데, 수치형 데이터 같은 경우는 숫자의 형태로 되어 있기 때문에 주로해당하는 열의 최빈값, 평균 값, 중앙값, 사분위 수 값으로 대체할 수 있다.하지만, 범주형 데이터는 문자형으로 되어 있기 때문에 처리하는 과정에서 수치형 데이터에 비해 조금 어렵다고 느껴졌다. 따라서, 이번 포스팅에서는 범주형 데이터의 결측치 처리하는 방법에 대해서 알아보고자 한다. Deletion (제거하기) - 데이터가 충분하고, 결측치를 ..
Light GBM은 XGBoost와 함께 부스팅 계열 알고리즘에서 가장 각광받고 있는 모델 중 하나이다. Light GBM의 가장 큰 장점은 역시나 학습에 걸리는 시간이 훨씬 빠른 것이다.XGBoost나 GBM을 이용하여 학습을 진행해본 사람들은 알겠지만, GridSearchCV를 이용하여 하이퍼 파라미터를 튜닝할 때 시간이 매우 오래걸린다는 단점이 있다.이를 해결하기 위해 "Light" GBM이 개발되었다. 속도가 개선된 것은 사실이지만, LightGBM은 한가지 단점이 존재한다.바로, 적은 데이터 세트에 적용할 경우 과적합이 발생하기 쉽다는 것이다. 따라서 일반적으로 10,000건 이하의 데이터 세트에는 잘 사용되지 않는다. LightGBMLightGBM은 리프 중심 트리 분할(Leaf Wise) 방..