파이썬(Python) 8

[python] matplotlib 한글 자음 모음 분리 현상

🤔 문제: 구글에서 검색해서 한글 폰트 설정하는 함수를 실행했더니 시각화 한 결과가 다음과 같이 자음과 모음이 분리된 채로 나온다. 구글링을 통해서 쉽게 찾을 수 있었다. 감사합니다..😍 💡 참고한 자료 : https://jonsyou.tistory.com/26 [Python] 한글 내용이 같지만 다르다고 인식하는 경우 분석 환경 Google Colab pro의 구성환경 Python Version : 3.7.10 상황 눈으로 볼 땐 두 한글 변수의 값이 같지만 비교 연산자 실행 시 다르다고 인식하는 상황. 더 나아가 두 변수를 같게끔 인식 시키고 싶 jonsyou.tistory.com 😯 요약하자면 unicodedata 모듈의 normalize 함수를 사용하여 해결했다. unicodedata 모듈 : 이..

파이썬(Python) 2024.01.09

[웹크롤링] window.scrollTo(0, document.body.scrollHeight)

웹 크롤링을 진행하는데 브라우저의 창을 현재 위치에서 문서의 맨 아래로 끝까지 내리는 JavaScript 코드가 다음과 같았다. window.scrollTo(0, document.body.scrollHeight) 여기서 document.body.scrollHeight는 현재 문서(body) 읯 총 높이다. 그렇다면 0은 무엇을 의미하는지 궁금해서 찾아봤다 (궁금한건 못참는 사람🖐️) 💡 0은 가로 스크롤을 의미한다고 한다. 스크롤의 위치를 지정할 때 (가로, 세로) 형태로 값을 지정하는데, 여기서 가로 스크롤은 0으로 설정되어 있다. 가로 스크롤은 보통 웹페이지에서 수직방향으로만 스크롤이 되는 경우에는 크게 중요하지 않다. 대부분의 경우 수직 스크롤이 주로 사용되기 때문에 수평 스크롤을 0으로 설정하는 ..

파이썬(Python) 2024.01.07

[python] predict vs predict_proba의 차이

predict() 는 범주의 예측을 반환 predict_proba()는 확률을 반환 1) predict() : predict의 경우, 각각 모델의 최종 예측값을 출력 회귀모델 : 특정 값 출력 ( 0.56 , 0.65 .. ) 분류모델 : 가장 확률이 높은 클래스 출력 (0 ,1 ,2 .. ) 2) predict_proba() : 분류모델이 각 클래스에 대한 확률을 출력 회귀에서는 사용할 수 없다 model = GradientBoostingClassifier(random_state = 0 , learning_rate = 0.01, n_estimators = 450) model.fit(x_train , y_train) #predict y_pred = model.predict(x_test) #pred_pro..

파이썬(Python) 2023.12.28

[python] 최댓값과 최솟값의 초깃값 설정

파이썬에서 최댓값과 최솟값의 초깃값을 지정하는 방법에 대해 알아보자 1. sys 모듈 사용하여 시스템이 가장 높은 값과 가장 낮은 값을 지정 mx = sys.maxsize mn = -sys.maxsize 2. float 이용해 무한대 값을 지정 mx = float('inf') mn = float('-inf') 💡주의! 좋지 않은 방법 mx = 999999 파이썬의 숫자형은 임의 정밀도를 지원하며 사실상 무한대의 값을 지정할 수 있다. 아무리 큰 수라 할지라도 얼마든지 더 큰 수가 지정될 수 있으므로, 이런 식으로 최솟값 변수에 임의의 값을 초깃값으로 지정하는 것을 지양해야 한다.

파이썬(Python) 2023.11.14

[Python] BeautifulSoup으로 HTML 파싱

웹 페이지를 표현하는 HTML 은 마크업 언어로 태그, 요소, 속성 등의 구성요소를 이용해 문서 구성을 구조적으로 표현하며, 구조화된 문서는 효율적으로 파싱(탐색)하고 원하는 정보를 찾아낼 수 있다. 쉽게 말해서, HTML은 일정한 규칙에 따라 작성되기 때문에, 우리가 그러한 규칙만 잘 파악할 수 있다면 웹 상에서 원하는 데이터를 손쉽게 가져올 수 있다는 말이다. 예를 들어보자 야구장에 수많은 관객들이 있다. 옆에 누군가가 멀리 보이는 관객들 중 한명을 집어서 저 사람한테 치킨을 가져다줘라고 하면 누구를 가리키는 것인지 쉽게 알 수 없다. 하지만 야구장의 객석은 구조화된 상태로 배열되어 있다. "A열 17번에 앉은 사람에게 치킨과 맥주를 가져다줘"와 같은 상태로 말할 수 있고, 우리는 누구를 지칭하는지 ..

파이썬(Python) 2023.11.07

[python] 상대경로 와 glob 함수

상대경로 상대경로는 현재 위치한 곳을 기준으로 하는 경로입니다 /는 루트 ./는 현재 위치 ../는 현재 위치의 상위 폴더 ../../ 는 두 단계 위의 상위폴더 파일 불러올 때 유용한 glob 함수 from glob import glob 아래와 같이 glob를 사용해 여러 파일을 한번에 로드 할 수 있습니다. 저는 아래와 같이 data/store폴더에 있는 .csv파일을 모두 불러왔습니다. file_csv = glob(data/store/*.csv) file_csv 💡여러 파일 한번에 합치기 file_list = [] for file_csv_name in file_csv : file_list.append(pd.read_csv(file_csv_name , low_memory = False)) df = p..

파이썬(Python) 2023.10.06

[python] 특정 기준으로 리스트 정렬하기 (key = lambda)

파이썬에서 배열을 정렬하기 위해서는 sorted()/sort()를 사용하여 내림차순,오름차순으로 정렬할 수 있습니다. 하지만 내가 원하는 특별한 기준으로 배열을 정렬하고 싶을 때는 key=lambda를 사용하면 됩니다. 1. Key가 하나일 때 ex) x를 기준으로 정렬하기 (일반 오름차순) 참고로 문자열은 다음과 같이 정렬하면 사전순으로 정렬이 된다 arr = ['abc' , 'bac' ,'bca'] sorted(arr , key = lambda x : x) ex) arr에 속하는 각 원소들을 x라고 생각했을 때, x[0]을 기준으로 정렬하기 arr = ['abc' , 'bac' ,'bca'] sorted(arr , key = lambda x : x[0]) 2. Key가 여러개 일 때 ex) x[0]을..

파이썬(Python) 2023.09.29