How to find the most frequent appearence in one column for different values in a different column of a grouped dataframe?

Question

The question is not so clear I guess, so here is an example: given a dataframe: company_name company_size company_acitivity 7 eleven 5 restaurant 7 eleven 5 supermarket 7 eleven 10 supermarket goldman sachs 100 bank goldman sachs 200 restaurant goldman sachs 200 bank I want to group the dataframe by company name and then replace the values in the organization_size

Accepted Answer

You don&#8217;t want to select a column after the groupby, since you want to apply that to all the available columns.Try this:df.groupby('company_name').apply(lambda x: x.mode()).reset_index(drop=True)Output:    company_name  company_size company_acitivity0       7 eleven             5       supermarket1  goldman sachs           200              bank

company_name	company_size	company_acitivity
7 eleven	5	restaurant
7 eleven	5	supermarket
7 eleven	10	supermarket
goldman sachs	100	bank
goldman sachs	200	restaurant
goldman sachs	200	bank

Advertisement

Answer