목록2022/02 (21)
Hey Tech
변경 전 파이썬 pandas 패키지로 엑셀 파일을 불러오면 아래와 같이 파일에는 없던 칼럼이 자동으로 추가되는 것을 볼 수 있습니다. 일단 데이터를 불러온 후에 해당 칼럼을 삭제하는 방법도 있지만, 번거로운 작업을 2번에 할 필요는 없겠죠. 그래서 이번 포스팅에서는 데이터를 불러올 때부터 해당 칼럼이 자동으로 생성되는 것을 방지하는 방법에 대해 알아봅니다. 변경 후 "Unnamed: 0" 칼럼 없이 파일을 불러오는 방법은 간단합니다. read 메소드 실행 시 index_col 옵션 값을 0으로 설정하는 것입니다. dataset = pd.read_csv("데이터셋 경로", index_col = 0) dataset.head() 위와 같이 옵션을 설정하면 이제 해당 칼럼("Unnamed: 0") 없이 데이터가..
변경 방법 변경하고자 하는 칼럼들의 순서대로 아래와 같이 나열하여 작성해 주면 됩니다. 데이터프레임 = 데이터프레임[['칼럼1', '칼럼2', ...]] 변경 전 아래 예시 데이터셋에서는 appName, review_raw, date_full, date_year 칼럼 순서입니다. dataset.head() 만약 date_full, date_year 칼럼을 review_raw 앞으로 이동하고 싶다면 어떻게 하면 될까요? 변경 후 date_full, date_year 칼럼을 review_raw 칼럼보다 앞서 입력하였습니다. dataset = dataset[['appName', 'date_full', 'date_year', 'review_raw']] dataset.head() 위와 같이 정상적으로 칼럼 순서가..
🔥 목표 오늘은 파이썬 map 함수와 lambda 함수를 활용하여 데이터를 핸들링하는 방법과 이점에 대해 알아봅니다. 👨💻 문제 상황 예시 데이터프레임 내 특정 칼럼의 데이터를 활용하여 어떠한 연산을 거쳐 새로운 값들로 이루어진 칼럼을 새롭게 생성하고 싶다면 어떻게 해야 할까요? 구체적인 예시와 함께 알아보겠습니다. 아래와 같이 dataset이라는 데이터프레임에 yyyymmdd 형식의 date 정보가 담긴 date_full 칼럼이 있다고 가정해 보겠습니다. 만약, 아래와 같이 연도 정보만 추출하여 date_year라는 칼럼에 새롭게 저장하고 싶다면 어떻게 코드를 작성해야 할까요? 💡 해결방법 1: 반복문 활용(Bad Case ❌) 반복문을 활용하여 date_full 칼럼 내 데이터를 한 개씩 접근하여 ..
본 포스팅에서는 venv를 활용하여 Python 가상환경 내 패키지 설치 및 관리 방법을 알아봅니다. 📚 목차 1. 가상환경 필요성 2. venv 활성화 3. 패키지 설치 4. 설치된 패키지 리스트 저장 5. 패키지 일괄 설치 1. 가상환경 필요성 가상 환경은 프로젝트마다 격리된 환경(즉, 가상 환경)을 생성함으로써 프로젝트별로 패키지를 관리하기 위함입니다. 파이썬을 입문하기로 마음 먹으셨다면 지금부터라도 가상 환경 사용을 권장해 드립니다. 가상 환경의 필요성에 대한 상세한 설명은 이 포스팅을 참고해 주세요. 2. venv 활성화 먼저 생성해 두었던 venv를 활성화해야 합니다. venv 가상환경 생성 및 활성화 방법은 이곳을 참고해 주세요. 참고로, Python 3.5 이후부터는 venv가 파이썬 표준..
본 포스팅에서는 venv를 활용하여 Python 가상환경을 생성하는 방법부터 활성화/비활성화, 삭제하는 방법까지 알아봅니다. 📚 목차 1. 가상환경 필요성 2. 가상환경 생성 3. 가상환경 활성화 4. 가상환경 비활성화 5. 가상환경 삭제 1. 가상환경 필요성 가상 환경은 프로젝트마다 격리된 환경(즉, 가상 환경)을 생성함으로써 프로젝트별로 패키지를 관리하기 위함입니다. 파이썬을 입문하기로 마음 먹으셨다면 지금부터라도 가상 환경 사용을 권장해 드립니다. 가상 환경의 필요성에 대한 상세한 설명은 이 포스팅을 참고해 주세요. 2. 가상환경 생성 참고로, Python 3.5 이후부터는 venv가 파이썬 표준 라이브러리에 내장되어 있기 때문에 따로 설치할 필요가 없습니다. Terminal 혹은 cmd 창을 여셔..