bash.im ithappens.me zadolba.li
11226

Сохраним вымирающих кракозябров

28 июля 2013, 07:15

Если кто ещё помнит, было время, когда существовало множество кодировок кириллицы: стандартная, досовская, виндовая, юниксовая, маковская. Сейчас, казалось бы, этому зоопарку пришёл конец: появилась UTF-8.

Но не всё так просто. Если кто встречал, иногда UTF-8 выглядит кракозябрами, при этом от «нормальной» она отличается значением первого байта: 0xD0 вместо 0xC2, например. Причём и то, и другое довольно часто в разных программах называют UTF-8, и тогда в их настройках сам чёрт ногу сломит.

Так вот, понадобилось как-то в этом разобраться, чтобы настроить нормальное отображение русских букв. Поиск выдал ссылку на форум, где кто-то как раз пытался выяснить этот же вопрос. А вот ответы убили:

— Не парься, скачай Штирлица.
— Не парься, подключи библиотеку iconv.
— Не парься, набей соответствие в табличку.

Люди, блин, программисты, вы что, с катушек совсем того? Проблема явно в неверном выборе кодировки, в путанице терминологии. Это неудивительно — в конце концов, авторы всех этих библиотек в большинстве англоязычные и вопрос русских букв их касается сугубо теоретически. Но вы-то программисты или быдлокодеры, готовые тупо наляпать десяток энкодеров один поверх другого вместо того, чтобы разобраться наконец, что есть что?

На фиг. Пошёл читать документацию в оригинале.