목록Info (4)
Hippo's data
안녕하세욥 오늘은 EDA (Exploratory Data Analysis)를 도와주는 여러가지 라이브러리에 대해 소개해보겠씁니당! 항상 본격적인 데이터분석에 앞서 EDA가 진짜 중요하다고들 하는데욥 특히 캐글이나 데이콘과 같은 분석 대회에서도 상위권 유저들의 EDA를 통해 도출한 분석 및 모델링 전략들은 정말 대단하도라구요,,,, 그렇다면 EDA (Exploratory Data Analysis)가 무엇일까요?한국어로는 탐색적 데이터 분석이라고 하는데욥 단어 그대로 데이터를 탐색하는 과정이라고 할 수 있습니다!즉, 데이터를 시각화하거나 통계량을 통해서 분포, 관계를 파악하며 데이터가 어떻게 생겼는지 파악하는 단계라고 할 수 있는데요! 근데 처음에는 어떤 그래프를 그리고 어떤 통계량을 살펴볼지 잘 모르겠고..
데이터분석을 할 때, EDA (Exploratory Data Analysis) 탐색적 데이터 분석은 필수적인 과정이죠! 그렇다면 EDA란 무엇일까요? 즉, 여러 그래프를 그려보거나 여러 통계를 찍어보는 등 데이터를 여러 각도에서 바라보며 씹고 뜯고 맛보고 즐기면서 분석의 다양한 전략을 세우는 단계라고 할 수 있는데욥! 오늘은 이러한 EDA 과정을 도와주는 매우매우 강려크한 오픈소스 pandas_profiling에 대해 소개해보려고 합니다!! pandas_profiling 에서는 아래와 같은 EDA 리포트를 제공해 줍니다! 기본 통계 정보: 각 열의 평균, 중간값, 표준편차, 최솟값, 최댓값 등.데이터 분포: 히스토그램이나 커널 밀도 추정(KDE) 등을 통해 각 열의 데이터 분포를 시각적으로 표현.결측치..
안녕하세욥 오늘은 깃허브 코파일럿(Github Copilot) 학생인증에 대해 알아보겠습니다!저는 항상 코드작성을 할 때 유료버전 ChatGPT 친구의 도움을 많이 받았는데요(내 20달러,,,,) 마침 ChatGPT 유료버전 사용기간도 끝난김에 깃허브 코파일럿(Github Copilot) 학생인증으로 공짜로 한번 써볼까나?라는 생각으루 도전해봤습니당 # 깃허브 코파일럿(Github Copilot)이란?깃허브와 오픈AI가 개발한 인공지능 도구인데요! vscode, Visual Studio, 젯브레인 등 여러 통합 개발 환경(IDE)에서 사용자들의 코드작성을 도와주는 도구입니다! 사실 Github Copilot은 Copilot Individual 버전의 경우 월10달러의 비용을 지불하고 유료로 사용할 수..
오늘의 포스팅은 구글검색(구글링) 하는 법입니다 프로그래밍 세계에는 독특한 문화가 있는데요 에러나 막히는 부분에 대한 해결책들을 인터넷상에서 조건없이 알려주고 나눠준다는 점입니다 이렇기에 모르는 점들이 생길때는 구글링을 통해 찾아내야 하는데요 원하는 정보를 빠르고 정확하게 찾는 구글링 역량은 IT 업계에서 꼭꼭꼭 필요한 역량입니다!! 저두 코드 에러가 생기거나 모르는 것들을 항상 열심히 구글링하면서 찾아보곤 합니다 (Chat gpt에 물어봐두 잘 대답해주지만 한계가 있긴 하드라구요...) 사실 구글링이 제한되면 아무것도 할 수 없어여.... 그래서 어떻게 검색을 하면 원하는 정보를 빠르고 정확하게 찾아낼 수 있을지 구글검색(구글링) 하는 법 에 대해 알아보겠습니다 - 특정 단어/문장 포함 -> "단어/문..