Grouping by multiple columns to find duplicate rows pandas

Question

I have a df I want to group by val1 and val2 and get similar dataframe only with rows which has multiple occurance of same val1 and val2 combination. Final df: Answer You need duplicated with parameter subset for specify columns for check with keep=False for all duplicates for mask and filter by boolean indexing: Detail:

Accepted Answer

You need duplicated with parameter subset for specify columns for check with keep=False for all duplicates for mask and filter by boolean indexing:df = df[df.duplicated(subset=['val1','val2'], keep=False)]print (df)   id  val1  val20   1   1.1   2.21   1   1.1   2.23   3   8.8   6.24   4   1.1   2.25   5   8.8   6.2Detail:print (df.duplicated(subset=['val1','val2'], keep=False))0     True1     True2    False3     True4     True5     Truedtype: bool

Advertisement

Answer