Всё (или почти всё) о пробеле |
|
|
| Рубрика: Заметки | |
| 09.04.2008 г. | |
|
Как следует из заголовка, речь в статье пойдёт о неотъемлемой части любого русскоязычного (и не только) текста — о пробеле. Мы затронем историю пробела, виды пробелов, вопросы употребления пробела в веб-типографике. Вообще говоря, пробел — это любое пустое место в рукописном, печатном или отображаемом на любом другом носителе тексте. Так что пробелы бывают разные:
Далее речь пойдёт о межсловных пробелах, разделяющих слова, и функционально принадлежащих к знакам препинания. История межсловного пробелаМежсловный пробел — сравнительно позднее изобретении в истории человеческой мысли. Глубоко история пробела изложена в книге Пола Санджера (Paul Saenger) «Space between Words: The Origins of Silent Reading», а также, несколько менее глубоко, в книге Иоганнеса Фридриха «История письма». Вкратце, пробел появился достаточно поздно, в тех письменностях, где отсутствие разграничения слов приводило к сложности чтения (так называемое консонантное письмо, где записываются только согласные звуки). Однако в греческом и латыни, в которых записывали и гласные звуки, использование пробела было утеряно. Пол Санджер связывает это с тем, что чтение производилось вслух, что упрощало разграничение слов при восприятии текста. Вновь пробел начал использоваться приблизительно в VII—IX вв. н. э., и эта традиция пришла из Ирландии, где у писцов и чтецов родным языком являлся древнеирландский, а религиозная литература записывалась на латыни. По-видимому, по этой причине монахи испытывали трудности с чтением вслух. Считается, что появление пробела плотно связано с постепенным переходом от чтения вслух к чтению про себя. Примерами книг на латыни с межсловными пробелами являются памятники британской литературы: Евангелие из Дарроу (VII в.) и Келлская книга (VIII—IX вв.). В глаголице и кириллице пробел также отсутствовал, и в привычном нам смысле используется только с XVII века. До того, как человечество изобрело наборный шрифт, никакой особенной классификации межсловных пробелов не было — ставили писцы пробелы на глазок и ставили. Напомним (мы писали об этом в статье «Выключка по ширине»), что рукопись и ксиллография относятся к способам создания текстов без подвижности литер. Естественно, пробелы могли получаться различной ширины, так как пропуски делались вручную. Пробелы в ручном набореКогда подвижность литер появилась (а произошло это с появлением наборных шрифтов), появились соответственно и вопросы — а как же ставить пробелы, чтобы соблюдалась выключка по ширине? Технология ручного набора такова, что набранная строка полностью зажимается в верстатке и в гранке, и, соответственно, должна иметь ширину, практически точно равную ширине полосы (подробнее с технологией ручного набора можно познакомиться в одноимённой книге М. В. Шульмейстера). Строка при ручном наборе набиралась из литер (брусков, на торце которых делались выпуклые зеркальные копии букв, отпечатывающиеся на бумаге), а межсловные пробелы создавались с помощью так называемых шпаций — брусков различной толщины, у которых на торце нет печатающей поверхности. Выглядит это примерно вот так. Шпации для каждого кегля шрифта, естественно, выпускались свои, и имели различную ширину. Например, для шрифта кегля 10 пунктов (стандартный кегль для большинства текстовых изданий) выпускались шпации шириной 10, 5, 4, 3, 2 и 1 пункт. Шпации шириной в кегль назывались кегельными или круглыми. Шпации в половину кегельной назывались полукегельными или полукруглыми. Также существует название «тонкая шпация», под которой понимают шпации толщиной 1—2 пункта для шрифта кегля 8—12 пунктов. То есть, для шрифта кегля 10 пунктов тонкая шпация обычно составляет 2 пункта (соответственно, 1⁄5 кегельной). Однако, в связи с отсутствием точного определения тонкой шпации, в руководствах издателя, редактора и верстальщика обычно говорят не об отбивке на тонкую шпацию, а об отбивке на столько-то пунктов (считая, что кегль шрифта равен 10 пунктам). Таким образом, нужно понимать, что в зависимости от кегля шрифта доля круглой шпации (треть, четверть и т. п.) может иметь разную ширину в пунктах, и наоборот. Традиционная ширина межсловного пробелаИтак, разобравшись с тем, что такое круглая и полукруглая шпации, перейдём к принятой в российском наборе ширине собственно межсловного пробела. Шульмейстер пишет (стр. 94), что при наборе строки между словами ставится полукруглая. Когда строка набрана до конца, в большинстве случаев её ширина оказывается либо меньше, либо больше ширины полосы набора. Поэтому верстальщику приходится изменять ширину пробелов, уменьшая её минимум до 1⁄4 круглой и увеличивая максимум до 3⁄4 круглой (соответственно, при наборе кеглем 10 пунктов межсловные пробелы могут варьироваться от 3 до 7 пунктов). Естественно, бывают нюансы, зависящие от формата издания, но мы их касаться не будем. Однако, Шульмейстер оговаривается, что сам по себе межсловный пробел в полукруглую великоват, и использование стандартного пробела в 1⁄3 круглой является как более экономичным с точки зрения расхода бумаги, так зачастую и более красивым. Также использование межсловного пробела в полукруглую не рекомендуется для узких шрифтов. С появлением строкоотливных машин пробелы стали делаться равномерными по ширине в пределах одной строки, а ширина межсловного пробела стала варьироваться около 1⁄3 круглой. Компьютерный набор и веб-типографикаВ настоящее время мы ограничены возможностями используемых шрифтов, и, естественно, набором символов в Unicode. Нужно помнить, что далеко не все шрифты содержат большинство пробельных Unicode-символов. При переходе к компьютерным системам вёрстки был совершён переход от указания ширины шпаций в пунктах к указанию ширины шпаций в долях круглой, так как шрифты стали легко масштабироваться до любого кегля, а пробельные элементы должны были оставаться пропорциональными кеглю шрифта. Символы пробела в UnicodeВ Unicode предусмотрены следующие символы для пробелов западной типографики.
Обычный и неразрывный межсловный пробелы входят в любой шрифт и правильно отображаются всеми агентами, если не считать отсутствия увеличения и уменьшения неразрывного пробела при выключке по ширине в некоторых текстовых процессорах и браузерах (что является нарушением рекомендаций). Например, FireFox правильно масштабирует неразрывные пробелы, а MSIE 7.0 не масштабирует их вовсе. Все остальные пробельные символы имеют фиксированную ширину и не растягиваются при выключке строк по ширине. Вместе с тем, согласно алгоритму разрыва строк в Unicode, все они должны обрабатываться как точка разрыва строки.
Использование различных пробеловПоскольку ширина межсловного пробела фиксирована в шрифте и изменяется автоматически при выключке по ширине, использование других пробельных символов в качестве межсловных оправдано только при наборе печатных изданий, и только при наличии глубокого понимания, для чего это делается. В обычной вёрстке для веба для разделения слов достаточно пользоваться обычными и неразрывными межсловными пробелами. Вместе тем, по правилам русскоязычной типографики в ряде мест должна использоваться тонкая шпация (точнее, в справочниках написано о двухпунктовой шпации, но мы будем употреблять термин «тонкая шпация» как наиболее соответствующий и с точки зрения устоявшейся терминологии, и с точки зрения внешнего вида строки при наборе). Основные правила использования пробелов будут описаны ниже, но в целом мы рекомендуем следующий принцип для использования при вёрстке для веба.
Использование только тонкой шпации из всего разнообразия пробельных элементов позволяет, во-первых, сохранить гармоничный вид набранного текста, а во-вторых, не перегружать автора публикации разнообразными правилами употребления шпаций различной дробной ширины. Обработка пробелов браузерами и поисковикамиПри подготовке материала статьи мы провели своеобразный эксперимент на специально подготовленной странице. Эта страница уже проиндексирована основными поисковиками, что позволяет проверить правильность индексации страниц с нестандартными пробельными элементами. Яндекс и Google справляются с этим хорошо, заменяя при поиске все нестандартные пробельные элементы на обычные (мы считаем, что это — правильное поведение). То есть, они не делают разницы между текстами «два слова», «два слова», «два слова» и т. п. Что касается обработки браузерами, то более-менее полную картину можно увидеть в результатах работы сервиса BrowserShots. Резюмируя, рендеринг нестандартных пробельных элементов работает в браузерах из рук вон плохо. Нормально справляются с задачей только Firefox 3.0 в Windows XP и *nix, MSIE 7.0 и Safari в Windows XP. Об MSIE 8.0 данных нет, но скорее всего, у него тоже всё в порядке.
Не вполне понятно, с чем связана одинаковая ширина всех пробельных элементов во всех браузерах под Mac. Вероятно, со встроенными шрифтами. Основные правила употребления пробеловИтак, ещё раз подчеркнём, что во всех правилах, перечисленных ниже, тонкая шпация используется только в том случае, когда автор отметает риск использования посетителем сайта браузеров, неверно отображающих тонкую шпацию. К ним относятся некоторые браузеры в *nix (возможно, это связано со встроенными шрифтами), MSIE версии 6.0 и раньше, браузеры для Mac (ими можно пренебречь, так как ошибка рендеринга заключается только в ширине шпации), возможно — некоторые браузеры для мобильных телефонов и КПК. В том случае, если использование таких браузеров вероятно, мы рекомендуем использовать вместо тонкой шпации обычный или неразрывный межсловный пробелы. Как было описано выше, согласно рекомендациям Unicode тонкая шпация является таким пробелом, где возможен разрыв строки. В тех случаях, когда правила требуют постановки тонкой шпации и запрета разрыва строки (например, между разрядами при наборе числа), необходимо использовать конструкцию типа Далее мы опишем те правила расстановки пробелов, которые чаще всего, по нашим наблюдениям, нарушаются при вёрстке текстов. Более подробную информацию о правилах набора текстов можно почерпнуть, например, в «Справочнике издателя и автора» А. Э. Мильчина и Л. К. Чельцовой. Сокращения и символы
Нужно учесть, что по поводу отбивки знаков процента и валют в среде типографов нет полностью устоявшегося правила, так что набор знака процента и символов валют вплотную к числу не является ошибкой, если такое употребление проводится единообразно на всём сайте. Однако, мы считаем, что использование пробела в данном случае улучшает читаемость текста. Числа и интервалы
Знаки препинания
Существует рекомендация отбивать тире на тонкую шпацию или не отбивать вообще от точки, запятой или кавычки. Это может быть оправдано при наборе печатного текста конкретным шрифтом, так как увеличивает однородность пробелов. В то же время, при просмотре текста для веба шрифты у пользователя могут быть совершенно разнообразными, из-за чего левый от тире пробел постоянно становится уже, чем правый. Нежелательные переносы
Эта статья также опубликована в блоге «Типографика» на сайте «Хабрахабр». Ключевые слова: пробел шпация круглая кегельная полукруглая полукегельная тонкая Сохранить в социальных сервисах (?)http://news2.ru/add_story.php?url=/blog/articles/2008/04/vsjo-o-probele.html&title=Всё (или почти всё) о пробеле" title="Добавить новость на News2" target="_blank"> |
|
|




Комментарии
2008-05-0609:33:03
en.wikipedia.org/.../...
2008-05-1222:34:55
Спасибо за комментарий, Евгений! Здесь исправил несколько позже, нежели на Хабре.