Pandas Filtering 속도 향상 ( Conditional Selection Speed Up)
실험 데이터 개수 : 약 160만개 단일값 검색 성능 비교 단순히 pd.series 를 사용한 indexing 의 처리 시간보다, numpy 문법을 사용했을 때 시간이 단축되었고, groupby 를 통해 key-value를 사용한 방법에서는 더 큰 시간 단축을 경험했다 기존 코드 : 2.6초 소요 for code in item_codes: ... item_info = train_data[train_data['item_code'] == code] # 2.6 초 ... 대안 1: numpy 배열 사용 ( 2.4초 소요, 0.2초 감소, 7.7% 향상) for code in item_codes: ... item_info = train_data[train_data['item_code'].values == cod..
개발/python-속도향상(optimization)
2022. 5. 17. 23:32