목록AI & 빅데이터/데이터 분석(Python) (18)
DATA101
📌 Text 빅데이터분석 플랫폼 베타테스트 참가자 모집 중!(네이버페이 4만 원 전원 지급) 👋 안녕하세요, 코딩이 필요 없는 AI/빅데이터 분석 All in One 플랫폼 개발팀입니다.😊 저희 서비스를 사용해 보시고 경험담을 들려주세요 :)💸 참여해 주신 "모든" 분들께 네이버페이 4만 원 쿠폰을 지급해 드립니다.👨💻 참여 희망 시 카톡플러스친구 1:1 채팅 or 인스타그램 DM 부탁드립니다 :)📆 참여기간 : 11/25(월)~11/29(금) 11:00~21:00 중 택1 (1시간 1타임)👉 참여장소 : 강남역 인근 스터디카페 미팅Room📍 소요시간 : 총 40분 내외(서비스 체험 및 인터뷰 포함)✅ 참가조건 : Text 빅데이터 분석 업무 경험자👉 참가 가능일정 조회하기 : ht..
패키지 import datetime는 기본 내장 패키지이므로 따로 설치하실 필요가 없습니다. from datetime import datetime 현재 시간 정보 now = datetime.datetime.now() print(now) 출력 결과 2022-06-23 12:18:53.198535 연도, 월, 일, 시, 분, 초 따로 구하기 연도(Year) print(now.year) # 2022 월(Month) print(now.month) # 6 일(Day) print(now.day) # 23 시(hour) print(now.hour) # 12 분(Minute) print(now.minute) # 18 초(Second) print(now.second) # 53 마이크로 초(Microsecond) prin..
본 포스팅에서는 Python pandas 패키지를 활용하여 결측치를 확인하고 제거하는 방법에 대해 다룹니다. 👨💻 들어가며 기본적으로 pandas 설치 및 import는 되어 있고 원하는 데이터셋도 불러왔다고 가정합니다. pandas 패키지 설치 !pip install pandas !pip install openpyxl # excel 파일 불러오기 위함 # pipenv 가상환경용 # !pipenv install pandas # !pipenv install openpyxl pandas 패키지 import import pandas as pd 데이터셋 Load dataset_raw = pd.read_excel("./data/dataset_raw.xlsx") 1. 결측치 확인 결측치 개수를 확인하는 방법은 크..
변경 전 파이썬 pandas 패키지로 엑셀 파일을 불러오면 아래와 같이 파일에는 없던 칼럼이 자동으로 추가되는 것을 볼 수 있습니다. 일단 데이터를 불러온 후에 해당 칼럼을 삭제하는 방법도 있지만, 번거로운 작업을 2번에 할 필요는 없겠죠. 그래서 이번 포스팅에서는 데이터를 불러올 때부터 해당 칼럼이 자동으로 생성되는 것을 방지하는 방법에 대해 알아봅니다. 변경 후 "Unnamed: 0" 칼럼 없이 파일을 불러오는 방법은 간단합니다. read 메소드 실행 시 index_col 옵션 값을 0으로 설정하는 것입니다. dataset = pd.read_csv("데이터셋 경로", index_col = 0) dataset.head() 위와 같이 옵션을 설정하면 이제 해당 칼럼("Unnamed: 0") 없이 데이터가..
변경 방법 변경하고자 하는 칼럼들의 순서대로 아래와 같이 나열하여 작성해 주면 됩니다. 데이터프레임 = 데이터프레임[['칼럼1', '칼럼2', ...]] 변경 전 아래 예시 데이터셋에서는 appName, review_raw, date_full, date_year 칼럼 순서입니다. dataset.head() 만약 date_full, date_year 칼럼을 review_raw 앞으로 이동하고 싶다면 어떻게 하면 될까요? 변경 후 date_full, date_year 칼럼을 review_raw 칼럼보다 앞서 입력하였습니다. dataset = dataset[['appName', 'date_full', 'date_year', 'review_raw']] dataset.head() 위와 같이 정상적으로 칼럼 순서가..
🔥 목표 오늘은 파이썬 map 함수와 lambda 함수를 활용하여 데이터를 핸들링하는 방법과 이점에 대해 알아봅니다. 👨💻 문제 상황 예시 데이터프레임 내 특정 칼럼의 데이터를 활용하여 어떠한 연산을 거쳐 새로운 값들로 이루어진 칼럼을 새롭게 생성하고 싶다면 어떻게 해야 할까요? 구체적인 예시와 함께 알아보겠습니다. 아래와 같이 dataset이라는 데이터프레임에 yyyymmdd 형식의 date 정보가 담긴 date_full 칼럼이 있다고 가정해 보겠습니다. 만약, 아래와 같이 연도 정보만 추출하여 date_year라는 칼럼에 새롭게 저장하고 싶다면 어떻게 코드를 작성해야 할까요? 💡 해결방법 1: 반복문 활용(Bad Case ❌) 반복문을 활용하여 date_full 칼럼 내 데이터를 한 개씩 접근하여 ..
안녕하세요, 오늘은 파이썬의 pandas 라이브러리를 활용하여 데이터프레임의 칼럼 이름을 변경하는 방법에 대해 공유해 드립니다. 그럼 바로 시작하죠! 목차 1. 데이터프레임 셋업 2. 칼럼 이름 변경하기 2.1. columns 함수: 새로운 칼럼 이름으로 덮어쓰기 2.2. rename 함수: 특정 칼럼만 지정하여 이름 변경하기 2.3. lambda 함수: 기존 칼럼 이름에 새로운 패턴 추가하기 1. 데이터프레임 셋업 판다스 모듈 설치하기 pip install pandas 판다스 라이브러리를 설치하지 않으셨다면 설치해 주세요. 판다스 모듈 불러오기 import pandas as pd 판다스 라이브러리를 불러옵니다. 데이터프레임 생성 df = pd.DataFrame({"식별번호": [1, 2, 3, 4, 5..
안녕하세요, 오늘은 파이썬을 활용하여 데이터프레임 내 특정 칼럼만 출력하는 방법에 대해 공유해 드립니다. 그럼 바로 시작하죠! 목차 1. 데이터프레임 셋업 2. 특정 칼럼만 지정하여 출력하기 2.1. 특정 칼럼 1개만 출력하기 2.2. 특정 칼럼 2개 이상 출력하기 2.2.1. 칼럼 이름 리스트 사용하기 2.2.2. loc 함수 사용하기 2.2.3. iloc 함수 사용하기 1. 데이터프레임 셋업 판다스 모듈 설치하기 pip install pandas 판다스 라이브러리를 설치하지 않으셨다면 설치해 주세요. 판다스 모듈 불러오기 import pandas as pd 판다스 라이브러리를 불러옵니다. 데이터프레임 생성 df = pd.DataFrame({"ID": [1, 2, 3, 4, 5], "Name": ["T..