How to calculate the hourly average of my data?

Question

I have the data from several sensors stored in a CSV file. The time resolution is one minute. The daily average for each sensor was easily calculated. I need to calculate the hourly average of the data. CSV data set format: First is date, second is time, third is parameter name, fourth is parameter code, and …

Accepted Answer

I think you need avoid loops in pandas, because slow and use:add parameter name for columns names and parse_date for datetimes to read_csvfilter by boolean indexingresample and aggregate mean, NaNs are omit by defaultimport pandas as pdtemp=u"""5/27/2016,0:00:00,Temperature,39,255/27/2016,0:00:00,Pressure,12,395/27/2016,0:00:00,Temperature,39,NaN5/27/2016,0:01:00,Temperature,39,25"""#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'names = ['date','time','name','parameter code','value']df = pd.read_csv(pd.compat.StringIO(temp), parse_dates=[['date','time']], names=names)print (df)            date_time         name  parameter code  value0 2016-05-27 00:00:00  Temperature              39   25.01 2016-05-27 00:00:00     Pressure              12   39.02 2016-05-27 00:00:00  Temperature              39    NaN3 2016-05-27 00:01:00  Temperature              39   25.0df = df[df['parameter code'] == 39]print (df)            date_time         name  parameter code  value0 2016-05-27 00:00:00  Temperature              39   25.02 2016-05-27 00:00:00  Temperature              39    NaN3 2016-05-27 00:01:00  Temperature              39   25.0df1 = df.resample('H', on='date_time')['value'].mean().reset_index(name='mean_val')print (df1)   date_time  mean_val0 2016-05-27      25.0

Advertisement

Answer