EDA
-
EDA) 인구소멸위기 지역 시각화, 카르토그램EDA 2023. 3. 10. 23:09
07. Population¶1. 배경¶ 목표 인구 소멸 위기 지역 파악 인구 소멸 위기 지역의 지도 표현 지도 표현에 대한 카르토그램 표현 In [1]: import numpy as np import pandas as pd import matplotlib.pyplot as plt import set_matplotlib_hangul import warnings warnings.filterwarnings(action="ignore") %matplotlib inline Hangul OK in your windows fillna()¶ In [2]: datas = {"A": np.random.randint(1,45,8), "B": np.random.randint(1,45,8), "C" : np.random.ran..
-
EDA) 네이버 API 활용EDA 2023. 3. 10. 23:04
06. Naver API¶ 1. 네이버 API 사용 등록¶ 네이버 개발자 센터 Application 어플리케이션 등록 사용 API 환경추가 -WEB설정 -http://localhost client ID: YcEkBF8FxV1SDWUqscNW Client Secret: OQCYXHHUbR https://developers.naver.com/apps/#/myapps/YcEkBF8FxV1SDWUqscNW/overview 2. 네이버 검색 API 사용하기¶ https://developers.naver.com/docs/serviceapi/search/blog/blog.md#%EB%B8%94%EB%A1%9C%EA%B7%B8 urllib: http 프로토콜에 따라서 서버의 요청/응답을 처리하기 위한 모듈 urllib..
-
EDA) 셀프 주유소 가격 분석EDA 2023. 3. 10. 23:01
04. Self Oil Station Price Analysis¶ 1. 셀레니움 설치¶ In [ ]: conda install selenium In [3]: from selenium import webdriver In [6]: driver = webdriver.Chrome("../driver/chromedriver.exe") driver.get("http://www.naver.com") In [7]: driver.quit() 2. 셀프 주유소가 정말 저렴한가요?¶ 데이터 확보하기 위한 작업 http://www.opinet.co.kr/searRgSelect.do 사이트 구조 확인 브랜드 가격 셀프 주유 여부 위치 3. 셀레니움으로 접근¶ In [61]: from selenium import webdrive..
-
EDA) Selenium 기초EDA 2023. 3. 10. 22:58
Selenium Basic¶ 1. selenium webdriver 사용하기¶ https://www.selenium.dev/documentation/ In [20]: from selenium import webdriver driver = webdriver.Chrome(executable_path="../driver/chromedriver.exe") driver.get("https://pinkwink.kr") In [3]: # 전체 종료 driver.quit() In [2]: # 화면 최대 크기 설정 driver.maximize_window() In [3]: # 화면 최소 크기 설정 driver.minimize_window() In [7]: # 화면 크기 설정 driver.set_window_size(60..
-
EDA) 네이버 영화순위 시각화EDA 2023. 3. 10. 22:56
03-2. Naver Movie Ranking¶ 1. 네이버 영화 평점 사이트 분석¶ http://movie.naver.com 영화랭킹 탭 이동 영화랭킹에서 평점순(현재상영영화) 선택 https://movie.naver.com/movie/sdb/rank/rmovie.naver?sel=cur&date=20230307 원하는 정보 얻기 위해서 변화시켜줘야 하는 주소의 규칙을 찾을 수 있음(날짜정보 변경 -> 해당 페이지로 접근 가능) In [1]: #requirements import pandas as pd from bs4 import BeautifulSoup from urllib.request import urlopen import warnings warnings.filterwarnings(action="..
-
EDA) 웹크롤링 기초 예제 - 시카고 샌드위치EDA 2023. 3. 10. 22:21
03. Web Data¶ 1. BeautifulSoup for web data¶ BeautifulSoup Basic¶ install -conda install -c anaconda beautifulsoup4 -pip install beautifulsoup4 data test_first.html In [1]: conda install -c anaconda beautifulsoup4 Collecting package metadata (current_repodata.json): ...working... done Solving environment: ...working... done # All requested packages already installed. Note: you may need to restar..
-
EDA) 서울시 범죄현황 시각화EDA 2023. 3. 10. 22:17
02. Analysis Seoul Crime¶ 1. 프로젝트 개요¶ 2. 데이터 개요¶ In [234]: import numpy as np import pandas as pd import openpyxl In [235]: # 데이터 읽기 crime_raw_data = pd.read_csv("../data/02. crime_in_Seoul.csv", thousands = ",", encoding="euc-kr") #thousands - 숫자값을 문자로 인식할 수 있어서 설정 crime_raw_data.head() Out[235]: 구분 죄종 발생검거 건수 0 중부 살인 발생 2.0 1 중부 살인 검거 2.0 2 중부 강도 발생 3.0 3 중부 강도 검거 3.0 4 중부 강간 발생 141.0 In [236]..
-
EDA) 서울시 인구수 및 CCTV 개수 시각화EDA 2023. 3. 10. 22:03
01. Analysis Seoul CCTV¶ 1. 데이터 읽기¶ In [1]: import pandas as pd In [2]: CCTV_Seoul = pd.read_csv("../data/01. Seoul_CCTV.csv") In [3]: CCTV_Seoul.head() Out[3]: 기관명 소계 2013년도 이전 2014년 2015년 2016년 0 강남구 3238 1292 430 584 932 1 강동구 1010 379 99 155 377 2 강북구 831 369 120 138 204 3 강서구 911 388 258 184 81 4 관악구 2109 846 260 390 613 In [4]: CCTV_Seoul.columns[0] Out[4]: '기관명' In [5]: CCTV_Seoul.rename(..