목록View All (350)
DATA101
❗️ 에러 메시지 컴파일 중 아래와 같은 에러를 마주하였습니다. Error: Could not find or load main class 패키지명.자바명 Caused by: java.lang.ClassNotFoundException: 패키지명.자바명 💡 원인 해당 에러의 원인은 이클립스 내 자바 라이브러리가 제대로 설정되어 있지 않기 때문입니다. 먼저, 코드 내 패키지, 클래스 이름, 파일명 등에 오탈자가 없는지 확인해 봅니다. 그럼에도 위와 같은 에러가 발생한다면, 아래의 해결방법을 참고해 주세요. ✅ 해결방법 Step 1. 프로젝트 Properties 접근 프로젝트 이름 우측 클릭 후 Properties 클릭합니다. Step 2. JRE System Library 체크 1) 좌측 메뉴바에서 Java ..
💡 들어가며 본 포스팅에서는 데이터를 주 단위로 카운팅하고 이를 시각화하는 방법을 소개합니다. 1. 패키지 import import pandas as pd import numpy as np import matplotlib.pyplot as plt 2. 데이터셋 불러오기 포스팅에서 사용되는 데이터셋은 공유가 불가하오니 학습 목적으로만 봐주시길 바랍니다. DATASET = pd.read_csv('./dataset_app_review.csv') DATASET.head() 3. 데이터 타입 확인 DATASET.dtypes 아래와 같이, 날짜 정보(date)는 현재 정수형(int)입니다. 편리하게 날짜형 데이터를 처리하기 위하여 이를 datetime 타입으로 바꿔줄 필요가 있습니다. 4. 데이터 타입 변경 "연-..
💡 들어가며 본 포스팅에서는 데이터를 월 단위로 카운팅하고 이를 시각화하는 방법을 소개합니다. 1. 패키지 import import pandas as pd import numpy as np import matplotlib.pyplot as plt 2. 데이터셋 불러오기 포스팅에서 사용되는 데이터셋은 공유가 불가하오니 학습 목적으로만 봐주시길 바랍니다. DATASET = pd.read_csv('./dataset_app_review.csv') DATASET.head() 3. 데이터 타입 확인 DATASET.dtypes 아래와 같이, 날짜 정보(date)는 현재 정수형(int)입니다. 편리하게 날짜형 데이터를 처리하기 위하여 이를 datetime 타입으로 바꿔줄 필요가 있습니다. 4. 데이터 타입 변경 "연-..
📚 목차 1. 사전 준비 2. 월 데이터 추출 3. 요일 데이터 추출 4. 특정 기간 데이터 추출 📌 1. 사전 준비 아래의 그림 1과 같이, 데이터셋에 날짜 데이터는 datetime 타입을 가지도록 사전에 준비해 주셔야 합니다. 만일, 날짜 데이터가 '20220101'과 같이 문자열이나 정수형이라면 아래의 포스팅을 참고하셔서 데이터 타입을 datetime으로 변경하시길 바랍니다. https://heytech.tistory.com/443?category=453614#recentComments [Python] 숫자형/문자열 데이터를 날짜형으로 바꾸기(pd.to_datetime) 📌 목표 숫자형 데이터를 날짜 형태로(i.e., datetime) 변환하기 예시: 20220816 (int) 👉 2022-08-1..
📌 목표 숫자형 데이터를 날짜 형태로(i.e., datetime) 변환하기 예시: 20220816 (int) 👉 2022-08-16 (datetime object) 🗂 목차 1. 데이터셋 예시 2. 데이터 타입 변경 3. 코드 뜯어보기 📝 데이터셋 예시 파이썬의 pandas 패키지를 활용하겠습니다. import pandas as pd 아래의 그림 1과 같이, 고객 ID, 리뷰 등록일, 텍스트 데이터가 담긴 데이터셋이 있습니다. 칼럼별 데이터 타입을 확인해 봅니다. 위의 그림 2와 같이, date 칼럼이 정수형인 것을 확인하실 수 있습니다. 💡 데이터 타입 변경 이제 date 칼럼을 datetime 형태로 변환해 보겠습니다. 🛠 코드 DATASET['datetime'] = DATASET['date'].ap..
💡 들어가며 Numpy 패키지의 where 함수를 사용하면 데이터프레임에서 특정 조건에 맞는 인덱스를 찾거나, 해당 인덱스의 값을 쉽게 바꿀 수 있습니다. 기본적으로 numpy 패키지 설치 및 import는 필수입니다. !pip install numpy import numpy as np 1. 조건에 맞는 인덱스 반환 아래와 같이 조건문을 입력하면, 조건에 해당되는 인덱스를 반환합니다. np.where(조건문) 아래와 같은 데이터셋이 있을 때, THK 칼럼 내 값이 30보다 큰 값의 인덱스를 조회해 보면 아래와 같습니다. np.where(30 < DATASET_RAW['THK']) 2. 조건에 따라 데이터 인코딩 아래와 같이, 조건문과 함께 조건문이 참 혹은 거짓일 경우 각각 데이터를 변환할 값을 입력해 ..
📌 Text 빅데이터분석 플랫폼 베타테스트 참가자 모집 중!(네이버페이 4만 원 전원 지급) 👋 안녕하세요, 코딩이 필요 없는 AI/빅데이터 분석 All in One 플랫폼 개발팀입니다.😊 저희 서비스를 사용해 보시고 경험담을 들려주세요 :)💸 참여해 주신 "모든" 분들께 네이버페이 4만 원 쿠폰을 지급해 드립니다.👨💻 참여 희망 시 카톡플러스친구 1:1 채팅 or 인스타그램 DM 부탁드립니다 :)📆 참여기간 : 11/25(월)~11/29(금) 11:00~21:00 중 택1 (1시간 1타임)👉 참여장소 : 강남역 인근 스터디카페 미팅Room📍 소요시간 : 총 40분 내외(서비스 체험 및 인터뷰 포함)✅ 참가조건 : Text 빅데이터 분석 업무 경험자👉 참가 가능일정 조회하기 : ht..
📚 목차 1. RNN 개념 2. RNN 수식 3. RNN 용도 1. RNN 개념 Recurrent Neural Network(RNN)은 자연어 문장과 같이 단어의 순서에 따라 의미가 달라지는 순차 데이터(Sequential Data)를 다룰 때 주로 사용되는 신경망입니다. 따라서 RNN은 단어의 어순에 따라 문장의 의미가 달라지고 앞에 어떤 단어가 쓰였는지 기억해야 뒤에 오는 단어를 예측하는 등의 문제를 풀 때 주로 활용됩니다. RNN은 Hidden Layer의 노드에서 활성화 함수(Activation Function)를 거쳐 나온 결괏값을 Output Layer로 보내면서 다시 다음 Hidden Layer 노드 계산의 입력값으로 보내는 신경망입니다. 이처럼, 결괏값이 다음 Hidden Layer 노드의..