Filter Pandas MultiIndex over all First Levels Columns

Question

Trying to find a way of efficiently filtering all entries under both top level columns based on a filter defined for only one of the top level columns. Best explained with the example below and desired output. Example DataFrame Create filter for multiindex dataframe Desired output: Answer You can reshape for simplify solution by reshape for DataFrame by DataFrame.stack with

Accepted Answer

You can reshape for simplify solution by reshape for DataFrame by DataFrame.stack with filter by DataFrame.where:df1 = df.stack()df_filter = df1['year']==2021df_filter = df1.where(df_filter).unstack()print (df_filter)            price                  year                          month0 month1 month2  month0  month1 month22020-12-31    NaN    4.0    NaN     NaN  2021.0    NaN2021-01-01    1.0    NaN    NaN  2021.0     NaN    NaNYour solution is possible, but more complicated &#8211; there is reshaped mask for repalce missing values by back and forward filling missing values:idx_cols = pd.IndexSlicedf_filter = df.loc[:, idx_cols['year', :]]==2021df_filter = df_filter.reindex(df.columns, axis=1).stack(dropna=False).bfill(axis=1).ffill(axis=1).unstack()print (df_filter)            price                 year                         month0 month1 month2 month0 month1 month22020-12-31  False   True  False  False   True  False2021-01-01   True  False  False   True  False  Falseprint (df[df_filter])            price                  year                          month0 month1 month2  month0  month1 month22020-12-31    NaN    4.0    NaN     NaN  2021.0    NaN2021-01-01    1.0    NaN    NaN  2021.0     NaN    NaN

Advertisement

Answer