Языки программирования

Кодировка UTF-8

При изготовлении первых компьютеров компании-производители применяли различные кодировки отображения символов. Кодировки изобретались самими производителями без учета проблемы совместимости в будущем. Но скоро потребовалось открывать файлы, созданные на чужих компьютерах. При открытии сайта, создававшегося на компьютере с другой кодировкой, текст отображался в виде мешанины символов или как «????????????».

Потребовалось срочно решить проблему. Выходом стало появление общепринятой кодировки UTF-8, которая включает 65536 символов.

Существует большое число кодировок. Но программируя, в Python и работая с любыми файлами используйте UTF-8. Использование других кодировок приведет к тому, что после передачи клиенту ваши программы могут работать не верно. И эта проблема будет вашей виной.

Для пользователей Windows уточняю, что изначальной кодировкой на вашем ПК является Windows-1251(cp1251). Поэтому рекомендую вам начинать файлы с расширением .py строкой: # -*- coding: utf-8 -*- При этом интерпретатор получает указание запускать файл в кодировке UTF-8.

Следующее занятие мы используем для изучения работы с файлами и обработки данных в Python.