Igor Vanin (one_in) wrote,
Igor Vanin
one_in

Category:

Клавиатурно-чарсетное псто

В комментариях к фотографиям в моих постах-фотопутешествиях часто приходится использовать в названиях многочисленные европейские буковки: ä, å, ā, æ, ö, ø и всякие другие (коих даже до юникодной эры накопилось пол-тыщи разных вариантов). Сразу возникли два вопроса: какую кодировку использовать и как их вводить с клавиатуры при наборе текста постов.

Первый вопрос был решён быстро: волевым решением была выбрана UTF-8 вместо UCS-2 / UTF-16-LE (ибо в юникодном Фаре и в веб-браузерах это пофигу, но первую хоть как-то можно использовать в php, тогда как второй вариант для php непригоден совсем).

Вопрос с клавиатурным вводом оказался сложнее. Попробовал в качестве эксперимента подключить третью клавиатурную раскладку (финскую) вдобавок к двум обычным - американской латинице и русской кирилице, но это мне абсолютно не понравилось, поскольку в стандартном виндовом переключателе нет возможности назначить включение разных раскладок разными кнопками, а перебирать в цикле по Alt-Shift (американская — финская — норвежская — французская — русская) абсолютно неюзабельно, потому что теперь для переключения вместо одного нажатия (что прошито в спинном мозге) приходится делать заранее неизвестное количество нажатий и постоянно всматриваться в индикатор, что там выбралось после каждого нажатия. Поэтому от такого способа пришлось отказаться.

Попробовал, работает ли в винде старый досовый способ: правый Alt с кодом символа на правой части клавиатуры. Оказалось, что работает в разных программах по-разному: в Фаре всегда получается юникодный символ по его десятичному юникодному коду (то, что надо!), а в Миранде, например, совсем по-другому — введённое число обрезается по модулю 256 и интерпретируется как десятичный код в текущей кодовой странице для неюникодных приложений (CP_ACP), несмотря на то, что Миранда — юникодная. В Опере юникодный ввод работает только если включен NumLock (а у меня он всегда выключен, старая детская привычка ещё с XT-шной клавиатуры). А во многих других приложениях не работает совсем никак, обрабатывается как Alt + стрелки. Поэтому от этого способа тоже пришлось отказаться. Да и вообще, при скорости набора порядка 250 символов в минуту пытаться вводить буковки по коду абсолютно неприемлимо, тормозит скорость печати в разы.

Поэтому пришлось изобрести свой способ: обозначать европейские буковки в исходниках постов специальными кодами, и потом подменять их макроподстановкой в том php-скрипте, которым я форматирую посты. Но это как-то идеологически некрасиво получается…

А как переключаетесь вы между разными клавиатурными раскладками? И какую кодировку используете в текстовых файлах?

Кстати, хорошее слово для тестирования вашей готовности к Unicode: «Įñţëřņâťīôňàŀiżæŧїøŋ»

У кого сколько букв не показалось? Должно получиться что-то похожее на "Internationalization" со всякими хвостиками и крючками.

Ещё один модный тренд, который хочу обсудить, это использование специальных юникодных знаков препинания. Говорят, что нынче уже не модно использовать один и тот же символ "-" в качестве тире ("—" и "–"), дефиса ("-" или "­") и минуса ("−"), кавычки должны быть не shift-2, а всякие красивые «»‘’‚‛“”„′″‹› — выбирай на любой вкус и цвет, а в качестве многоточия теперь нельзя использовать много точек..., а следует использовать одно троеточие…

А вы что об этом думаете? Не похеру ли вам, какие кавычки используются в тексте? Негодуете ли вы, когда видите в постах тире или минус "не той системы" или три точки вместо троеточия?

Меня эти тире и минусы немного озадачили: я теперь не понимаю, какой знак использовать в качестве носа у классического смайлика :-). Это проблема. И остаётся поднятый выше вопрос: как вводить с клавиатуры всю эту красоту.

Tags: компьютерное, пост без фото
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 43 comments