목록2025/01 (3)
Hippo's data
오늘은 다운캐스팅(Downcasting)에 대해 알아보겠습니다!데이터를 불러와서 모델링을 하다보면 데이터가 너무 커서 속도가 너무 오래걸리거나, 메모리 초과(OOM: out-of-memory) 오류가 발생하는 경우가 종종 있는데욥! 이를 해결하기 위해 데이터 사이즈를 줄이는 다운캐스팅(Downcasting) 방법을 이용할 수 있습니다!! 파이썬(Python)에서는 정수, 부동소수점 변수 저장시 메모리에서 차지하는 바이트에 기반하여 데이터 타입을 선택하게되는데욥 데이터 값을 손상시키지 않으면서 각 변수를 저장하는 가장 용량이 적은(메모리를 적게 사용하는) 데이터 타입으로 저장하여 데이터의 총 사이즈를 줄일 수 있습니다. 즉, 무손실 압축(lossless compression)이 가능합니다! 예) int64..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cQ7eEm/btsLWvlWMh2/Hfm67guDmOGXKknAqNPj7K/img.png)
안녕하세욥 오늘은 EDA (Exploratory Data Analysis)를 도와주는 여러가지 라이브러리에 대해 소개해보겠씁니당! 항상 본격적인 데이터분석에 앞서 EDA가 진짜 중요하다고들 하는데욥 특히 캐글이나 데이콘과 같은 분석 대회에서도 상위권 유저들의 EDA를 통해 도출한 분석 및 모델링 전략들은 정말 대단하도라구요,,,, 그렇다면 EDA (Exploratory Data Analysis)가 무엇일까요?한국어로는 탐색적 데이터 분석이라고 하는데욥 단어 그대로 데이터를 탐색하는 과정이라고 할 수 있습니다!즉, 데이터를 시각화하거나 통계량을 통해서 분포, 관계를 파악하며 데이터가 어떻게 생겼는지 파악하는 단계라고 할 수 있는데요! 근데 처음에는 어떤 그래프를 그리고 어떤 통계량을 살펴볼지 잘 모르겠고..
오늘은 데이터분석, AI 연합동아리 (투빅스, 보아즈, 비타민) 지원후기를 올려보려고 합니당 저는 데이터, AI 분야에 흥미를 가진 후로 줄곧 혼자 공부해왔었는데욥 이번기회에 여러명이서 체계적으로 함께 공부하면 좋을 것 같아서 여러 활동, 스터디들을 찾아보다가 데이터, AI 분야 유명한 연합동아리들을 발견했는데욥 대표적으로 3개 (투빅스, 보아즈, 비타민)를 추릴 수 있었습니다!지원서는 돈드는거 아니라고,,,, 다다익선으로 다 지원을 해보았는데욥 이와 관련해서 지원서, 면접 후기를 남겨보려 합니답!!면접본지 꽤 지나가지구 확실히 기억나진 않지만 제 기억 저편의 조각들을 잘 조합해서 후기를 남겨보겠습니담 지원과정은 서류, 면접으로 동일했고 비타민 동아리만 코딩테스트가 추가로 있었습니답 비타민1차 서류1..