Converting utf-8 encoded to string from user input in python

Question

The first one can print out the result correctly While the second one will just print out the string I entered output: Answer The transformation is a bit tricky: Follow the transformation:

Accepted Answer

The transformation is a bit tricky:# Use r'', simulate inputa = r'xe6xb8xacxe8xa9xa6'print(a.encode('ascii').decode('unicode-escape').encode('latin-1').decode('utf-8'))Follow the transformation:# Step 0 (initial)print(a)xe6xb8xacxe8xa9xa6# Step 1print(a.encode('ascii'))b'\xe6\xb8\xac\xe8\xa9\xa6'# Step 2print(a.encode('ascii').decode('unicode-escape'))æ¸¬è©¦# Step 3print(a.encode('ascii').decode('unicode-escape').encode('latin-1'))b'xe6xb8xacxe8xa9xa6'# Step 4 (final)print(a.encode('ascii').decode('unicode-escape').encode('latin-1').decode('utf-8'))測試

Advertisement

Answer