Pandas: Split and/or update columns, based on inconsistent data?

Question

So I have a column that contains baseball team names, and I want to split it into the 2 new columns, that will contain separately city name and team name. Team New York Giants Atlanta Braves Chicago Cubs Chicago White Sox I would like to get something like this: Team City Franchise New York Giants New York Gi…

Accepted Answer

Use:#part of cities with spacecities = ['York','Angeles']#test rowsm = df['Team'].str.contains('|'.join(cities))#first split by first space to 2 new columnsdf[['City','Franchise']] = df['Team'].str.split(n=1, expand=True)#split by second space only filtered rowss = df.loc[m, 'Team'].str.split(n=2) #update valuesdf.update(pd.concat([s.str[:2].str.join(' '), s.str[2]], axis=1, ignore_index=True).set_axis(['City','Franchise'], axis=1))print (df)                Team      City  Franchise0    New York Giants  New York     Giants1     Atlanta Braves   Atlanta     Braves2       Chicago Cubs   Chicago       Cubs3  Chicago White Sox   Chicago  White Sox

Team	City	Franchise
New York Giants	New York	Giants
Atlanta Braves	Atlanta	Braves
Chicago Cubs	Chicago	Cubs
Chicago White Sox	Chicago	White Sox

Advertisement

Answer