목록AI & 빅데이터 (113)
DATA101
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bMIRbX/btrmxHkyrmX/0LMqGjDQgY8odloiCcLCzk/img.png)
💡목표 MacOS(i.e., 맥북, 아이맥)에서 MySQL을 설치/실행/중지/삭제하는 방법에 대해 학습한다. 목차 1. MySQL 설치 2. MySQL 실행 3. MySQL 중지 4. MySQL 삭제 1. MySQL 설치 Home Brew를 활용해 MySQL을 설치해 줍니다. brew install mysql MySQL 설치 확인 MySQL이 정상적으로 설치되었는지 확인해 줍시다. service list에 mysql이 출력되면 정상적으로 설치된 것입니다. brew services 2. MySQL 서버 실행 MySQL 서버를 실행합니다. mysql.server start MySQL 서버 실행 확인 MySQL이 정상적으로 서비스 되고 있는지 확인하겠습니다. brew services MySQL 사용 포트 확인..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/1mNrl/btrmhIZTDFg/7RjD4YOLMk54O9tf8Rp61K/img.png)
💡 학습목표 MySQL에서 테이블 내 특정 데이터를 변경하는 방법 연습하기 Update 구문 테이블 내 특정 값을 변경하고자 할 때는 Update 문법을 사용합니다. 사용방법은 다음과 같습니다. 1) UPDATE 구문 뒤에 수정할 테이블 이름 입력 2) SET 구문 뒤에 수정할 칼럼과 데이터 값 입력 3) WHERE 구문 뒤에 수정할 데이터 선별 조건 입력 UPDATE 테이블이름 SET 칼럼1 = 값1, 칼럼2 = 값2, 칼럼3 = 값3, ... WHERE 조건문; 예시(1): Where 구문 사용 예를 들어, Cutomers라는 테이블에 Tony라는 고객의 ID와 주소를 바꾼다고 했을 때 Where 구문을 활용하여 아래와 같이 구문을 작성할 수 있습니다. UPDATE Customers SET Custo..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/kHwAu/btrmhvsjNFG/ozhRUMacKKIG7aK41k6VJK/img.png)
관계형 데이터베이스 관리 시스템이란? RDBMDS(Relational Database Management System), 관계형 데이터베이스 관리 시스템은 말 그대로 관계형 데이터베이스를 유지보수하는 데 사용되는 프로그램입니다. 즉, RDBMS는 SQL 쿼리문을 활용해 데이터베이스 내 데이터를 생성, 업데이트, 삭제하는 프로그램이죠. 대중적으로 알려진 RDBMS 프로그램으로는 MySQL, Oracle, PostgreSQL, SQLite, Microsoft SQL Server 등이 있습니다. 데이터베이스 테이블이란? 데이터베이스 테이블(Database Table)은 행(row)과 열(column)로 구성된 데이터 묶음입니다. 데이터베이스는 여러 테이블을 포함합니다. 하나의 열은 데이터에 대한 구체적인 정보..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/cpp2Cv/btrgA7c1e7p/blrtQjjGO8aHoAZT71ZMsk/img.png)
안녕하세요, 오늘은 머신러닝 알고리즘 Random Forest로 Binary Classification 모델링하는 절차와 방법을 공유하고자 합니다. 실습 데이터는 오픈소스인 Wine Quality Data Set입니다. 1. 실습코드 및 데이터셋 데이터셋과 전체 파이썬 코드는 이곳에서 받으실 수 있습니다. GitHub - park-gb/wine-data-classification: The wine data classification using machine learning algorithms The wine data classification using machine learning algorithms - GitHub - park-gb/wine-data-classification: The wine dat..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/TOPE3/btrgBJvJaBT/uSkjmpkN8RkikscJ9iwBg1/img.png)
📚목차 1. 랜덤포레스트 정의 2. 랜덤포레스트 장단점 3. 실습코드 및 데이터셋 4. 코드 설명 1. Random Forest 정의 Random Forest는 의사결정나무 모델 여러 개를 훈련시켜서 그 결과를 종합해 예측하는 앙상블 알고리즘입니다. 각 의사결정나무 모델을 훈련시킬 때 배깅(Bagging) 방식을 사용합니다. 배깅은 전체 Train dataset에서 중복을 허용해 샘플링한 Dataset으로 개별 의사결정나무 모델을 훈련하는 방식입니다. 이렇게 여러 모델을 통해 예측한 값은 평균을 취하여 최종적인 예측값을 산출합니다. 이 배깅 방식은 예측 모델의 일반화(generalization, a.k.a., 안정성) 성능을 향상하는 데 도움이 됩니다. 2. 랜덤포레스트 장단점 장점 단점 일반화 및 성능..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/tOQic/btrgzJoMa5O/QT0K7jX1jCkOSGrGBxCnC0/img.gif)
필독! 안녕하세요, 구글 플레이 스토어 웹 페이지 구조가 변경됨에 따라 현재 포스팅에 업로드한 크롤러는 작동하지 않습니다. 개편된 웹 페이지 구조를 고려하여 크롤러를 업데이트하였습니다. 아래 포스팅을 참고해 주세요! 감사합니다. https://heytech.tistory.com/293 [Python] 구글 플레이 스토어 웹 크롤러 코드 Version2 안녕하세요! 오늘은 파이썬(주피터 노트북)을 기반으로 직접 코딩한 구글 플레이 스토어 웹 크롤러 코드를 공유합니다. 📝 목차 1. 업데이트 Log 2. 주요 기능 3. 전체 코드 4. 필수 초기 세팅 5. heytech.tistory.com 안녕하세요! 오늘은 파이썬(주피터 노트북)을 기반으로 직접 코딩한 구글 플레이 스토어 웹 크롤러 코드를 공유합니다. ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/Dqzuz/btrfzlhtGXZ/xWV9DSKpoEEl5YstgeKk70/img.png)
오늘은 모바일 뱅킹 App 리뷰 텍스트마이닝 관련 논문을 방법론 위주로 빠르게 리뷰해 보겠습니다.그럼 바로 시작하죠!📚 논문 출처 APALeem, B. H., & Eum, S. W. (2021). Using text mining to measure mobile banking service quality. Industrial Management & Data Systems.💡 요약카카오뱅크 앱 리뷰 텍스트마이닝을(키워드 추출, 토픽 모델링, 감정분석) 통해 모바일 뱅킹 앱 서비스 퀄리티 평가한 논문1. 데이터 수집 및 전처리1.1. Data collection- 데이터: 카카오 뱅크 고객 리뷰 3,900건- 수집 출처: 구글 플레이 스토어- 수집 방법: WebHarvy 웹 크롤링 솔루션 활용- 수집일..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/H7shl/btrfc572l1g/hjJSiepyZaSGo04tbURuy1/img.png)
📚 목차 1. 의사결정나무란? 2. 의사결정나무의 장단점 3. 의사결정나무 구조 및 용어 4. 의사결정나무의 분리조건 4.1. 의사결정나무 기반 예측 모델링 4.1.1. MSE(Mean Squared Error, 평균 제곱 오차) 4.1.2. MAE(Mean Absolute Error, 평균 절대 오차) 4.2. 의사결정나무 기반 분류 모델링 4.2.1. 지니 지수(Gini Index) 4.2.2. 엔트로피 지수(Entropy Index) 5. 의사결정나무 변수별 중요도 계산 1. 의사결정나무란? 의사결정나무(Decision Tree)는 설명변수(X) 간의 관계나 척도에 따라 목표변수(Y)를 예측하거나 분류하는 문제에 활용되는 나무 구조의 모델입니다. 즉, 설명변수의 관측값을 모델에 입력해 목표변수를 분..