Pandas row iteration 속도 향상 (Speed Up)
일반적으로, pandas 에서 apply() 를 활용했을 때 데이터의 행들을 순회하며, 전처리 적용이 빠르게 가능하고, 나도 apply() 를 매우 자주 사용하는 편이다 그런데 종종 해당 row들을 순회하며, 데이터를 처리하여 열을 만드는 것이 아닌, 다른 목적으로 특정 데이터들을 뽑아내서 따로 저장해야할 때가 있다. 혹은 apply() 사용 시 debugging 용도로 반복문을 통한 DataFrame 순회가 필요할 때가 있다. 이 때 일반적으로 iterrows() 를 사용한다 # iterrows() 사용 temp=[] for i,row in df.iterrows(): name_new = row['name'] temp.append(name_new) 그런데 이 방법은 단순하나, 속도가 아쉬운 특징이 있다...
개발/python-속도향상(optimization)
2022. 5. 12. 19:09