분류 전체보기 (7) 썸네일형 리스트형 ✋ [Python] 데이터 시각화 Plotly, matplotlib !! 1. Reading The datasets (data set 불러오기 train_data and clinical_data) # Reading The datasets (data set 불러오기 train_data and clinical_data) train_clinical_data = pd.read_csv('/content/drive/MyDrive/YS_edu/data/amp-parkinsons-disease-progression-prediction/train_clinical_data.csv') train_peptides = pd.read_csv('/content/drive/MyDrive/YS_edu/data/amp-parkinsons-disease-progression-prediction/train_pe.. ✋ [Python] 만개의 레시피 사이트 Crawling !! - 코드 Flow 1. 페이지 수(page)와 데이터 리스트(data)를 초기화합니다. 2. 필요한 라이브러리(requests, BeautifulSoup)를 import 합니다. 3. 검색어(word)와 검색결과 페이지의 url을 설정합니다. 4. 검색결과 페이지(url)를 requests.get() 함수를 통해 가져옵니다. 5. 가져온 페이지(r)를 BeautifulSoup을 이용해 파싱합니다. 6. 검색결과 총 개수(total)와 리스트 데이터(li_list)를 가져옵니다. 7. 총 페이지 수(max_num)를 계산합니다. 8. while 반복문을 사용해 페이지를 하나씩 넘어가며 데이터를 수집합니다. 9. 리스트 데이터(li_list)를 for 반복문으로 순회하며, 필요한 정보(img, title, .. ✋ [Python] matplotlib 란 ? matplotlib 는 데이터 시각화 하는 대표적인 라이브러리 !! 1. plt 모듈을 이용하여 plot 간단하게 그려보기. # matplotlib.pyplot 모둘을 plt 로 호출 import matplotlib as mpl import matplotlib.pyplot as plt # matplotlib version 확인 print(mpl.__version__) # plt 모듈로 간단 하게 plot 그려보기 plt.plot([10,20,30,40]) plt.show() 2. matplot 을 객체 지향으로 그리기 ! fig, ax = plt.subplots(nrows = 2, ncols = 2, figsize=(10,6)) plt.show() dates = [ '2021-01-01', '2021-0.. ✋ [Python] Pandas Group_by 란 ? Pandas 의 Method 중 groupby() 는 데이터를 그룹별로 분할하여, 독립화된 그룹을 별도의 데이터 처리 하거나 그룹별 통계를 확인 하는데 사용하는 함수 입니다. 위 이미지는 iris(붓꽃) 데이터를 종별 mean 값을 groupby() 메소드를 이용해 데이터 처리한 것 입니다. 1. 먼저 iris 데이터를 pandas method로 가져와 변수에 선언해보자. import pandas as pd data_path = '/content/drive/MyDrive/YS_edu/data/' col_names = ["sepal_length","sepal_width","petal_length","petal_width","sepcise"] iris = pd.read_csv(data_path + "iris.. ✋ [Python] Step 1. Pandas Pandas의 기본 method 익히기 ! pd.read_csv() csv 파일로 저장된 데이터를 pandas로 불러 오는 method 다양한 확장자의 파일을 불러올 수 있음. ex) excel,sql,json import pandas as pd data_path = "/content/drive/MyDrive/YS_edu/data/" titanic = pd.read_csv(data_path + "타이타닉.csv") df.head(n) & data.tail(n) df.head(n) = 첫번째 행부터 n 행까지 반환 df.tail(n) = 마지막 n 행 반환 titanic.head(8) titanic.tail(8) df.info() df의 데이터 유형 확인 method • 데이터 유형은 주로 DataFram.. ✋ [Python] Pandas Pkg 란 ? Pandas (Python Data Analysis Library) Pandas는 데이터 전 처리를 위한 대표적이며, 가장 인기 있는 Library 중 하나 이다. 데이터 분석에 사용하는 데이터 구조는 주로 행렬 2차원 구조를 가졌으며, Pandas는 행렬 2차원 구조를 handling 하기 적합하다. 데이터 분석의 핵심은 Sampling 및 데이터 정제 라고 할 정도로 raw data 를 가공된 데이터로 만드는 과정은 데이터 분석에 있어 중요한 과정 중 하나 이다. Pandas pkg library import pandas as pd panda pkg 를 사용하기 위해 pandas 의 별칭을 pd 로 가져와 활성화 시킴. 관행 적으로 pandas 의 별칭을 “pd” 라고 선언 함. Pandas 시리즈(.. 네이버 쇼핑 api 를 이용한 Python Crawling !! ✋ 스마트 스토어 마케팅 전략 을 위한 어플 개발 기간 : 2023/03/01 ~ 2023/03/03 🔥 PPT 자료 : https://drive.google.com/file/d/1doSmWEdRa6yr3jbZbmDk28TN6aphcm9W/view?usp=share_link 주제 선정 배경 최근 몇년간 투잡에 관심도 높아짐에 따라 스마트 스토어 관심도 높아짐. 전자상거래 시장규모 매년 증가하는 추세 임. 사용 용도 User_Target : 스마트 스토어 예비 창업자 및 스마트 스토어 운영중인 사업자 연령대, 성별, 접속 환경 별 특정 상품에 대한 상대 클릭 수를 plot 시각화 가능. → 맞춤 광고 전략 수립 가능 팔고자 하는 상품의 인기 상품 상위 100개의 평균 가격과 해당 상품이 가장 많이 팔리는 .. 이전 1 다음