항상 감사하며 마633

고정 헤더 영역

글 제목

메뉴 레이어

항상 감사하며 마633

메뉴 리스트

  • 홈
  • 태그
  • 방명록
  • 분류 전체보기 (93)
    • 개발 (59)
      • 개발환경설정 (6)
      • python-심화(Advanced) (23)
      • python-객체지향프로그래밍(OOP) (21)
      • python-병렬처리 (7)
      • python-속도향상(optimization) (2)
    • Study (16)
      • DeepLearning from scratch (16)
    • paper review (15)
      • NLP (15)
    • Google Machine Learning Boo.. (3)

검색 레이어

항상 감사하며 마633

검색 영역

컨텐츠 검색

개발/python-속도향상(optimization)

  • Pandas Filtering 속도 향상 ( Conditional Selection Speed Up)

    2022.05.17 by Matthew0633

  • Pandas row iteration 속도 향상 (Speed Up)

    2022.05.12 by Matthew0633

Pandas Filtering 속도 향상 ( Conditional Selection Speed Up)

실험 데이터 개수 : 약 160만개 단일값 검색 성능 비교 단순히 pd.series 를 사용한 indexing 의 처리 시간보다, numpy 문법을 사용했을 때 시간이 단축되었고, groupby 를 통해 key-value를 사용한 방법에서는 더 큰 시간 단축을 경험했다 기존 코드 : 2.6초 소요 for code in item_codes: ... item_info = train_data[train_data['item_code'] == code] # 2.6 초 ... 대안 1: numpy 배열 사용 ( 2.4초 소요, 0.2초 감소, 7.7% 향상) for code in item_codes: ... item_info = train_data[train_data['item_code'].values == cod..

개발/python-속도향상(optimization) 2022. 5. 17. 23:32

Pandas row iteration 속도 향상 (Speed Up)

일반적으로, pandas 에서 apply() 를 활용했을 때 데이터의 행들을 순회하며, 전처리 적용이 빠르게 가능하고, 나도 apply() 를 매우 자주 사용하는 편이다 그런데 종종 해당 row들을 순회하며, 데이터를 처리하여 열을 만드는 것이 아닌, 다른 목적으로 특정 데이터들을 뽑아내서 따로 저장해야할 때가 있다. 혹은 apply() 사용 시 debugging 용도로 반복문을 통한 DataFrame 순회가 필요할 때가 있다. 이 때 일반적으로 iterrows() 를 사용한다 # iterrows() 사용 temp=[] for i,row in df.iterrows(): name_new = row['name'] temp.append(name_new) 그런데 이 방법은 단순하나, 속도가 아쉬운 특징이 있다...

개발/python-속도향상(optimization) 2022. 5. 12. 19:09

추가 정보

인기글

최신글

페이징

이전
1
다음
TISTORY
항상 감사하며 마633 © Magazine Lab
페이스북 트위터 인스타그램 유투브 메일

티스토리툴바