Filter Pandas MultiIndex over all First Levels Columns

Question

Trying to find a way of efficiently filtering all entries under both top level columns based on a filter defined for only one of the top level columns. Best explained with the example below and desired output. Example DataFrame Create filter for multiindex dataframe Desired output: Answer You can reshape for …

Accepted Answer

You can reshape for simplify solution by reshape for DataFrame by DataFrame.stack with filter by DataFrame.where:df1 = df.stack()df_filter = df1['year']==2021df_filter = df1.where(df_filter).unstack()print (df_filter)            price                  year                          month0 month1 month2  month0  month1 month22020-12-31    NaN    4.0    NaN     NaN  2021.0    NaN2021-01-01    1.0    NaN    NaN  2021.0     NaN    NaNYour solution is possible, but more complicated &#8211; there is reshaped mask for repalce missing values by back and forward filling missing values:idx_cols = pd.IndexSlicedf_filter = df.loc[:, idx_cols['year', :]]==2021df_filter = df_filter.reindex(df.columns, axis=1).stack(dropna=False).bfill(axis=1).ffill(axis=1).unstack()print (df_filter)            price                 year                         month0 month1 month2 month0 month1 month22020-12-31  False   True  False  False   True  False2021-01-01   True  False  False   True  False  Falseprint (df[df_filter])            price                  year                          month0 month1 month2  month0  month1 month22020-12-31    NaN    4.0    NaN     NaN  2021.0    NaN2021-01-01    1.0    NaN    NaN  2021.0     NaN    NaN

Advertisement

Answer