zope.phdru.name as an example of dynamic site

<dtml-var standard_html_header>

<h1 align="center">Создание динамических сайтов на платформе Zope на примере
сайта zope.phdru.name</h1>

<p class="head">
Автор: <a href="http://phdru.name/">Олег Бройтман</a>
</p>


<pre>
ВВЕДЕНИЕ
--------
</pre>

<p>
   <a href="http://www.zope.org/">Zope</a> - это объектно-ориентированная
платформа для создания интерактивных, динамических сайтов и web-приложений.
В этой лекции я расскажу и покажу, как создаются динамические сайты на
примере сайта zope.phdru.name; интерактива на сайте пока нет, но динамические
объекты есть. Сайт недавно переехал на хороший хостинг, и его можно наконец
загружать примерами и пр.
</p>

<p class="head">
   Для того, чтобы не повторять уже много раз сказанное, отсылаю
заинтересованного читателя к
<a href="http://zope.phdru.name/Zope/Intro/Oleg_Broytmann/phd2.html">моей
предыдущей статье</a>, в которой рассказаны общие принципы, устройство
web-application server Zope, дана и пояснена необходимая терминология.
Особенно прошу обратить внимание на описание механизма acquisition - на
сайте zope.phdru.name этот механизм используется, хотя и не во всю свою силу.
</p>

<p class="head">
   В целом сайт <a href="http://zope.phdru.name/">zope.phdru.name</a> не только
community site нашей Группы Пользователей, но и реальный demo-site, на
котором можно посмотреть, что и как устроено. Все "конечные" объекты
(страницы, видимые пользователю) имеют ссылку "Показать DTML код объекта".
Но многое остается скрытым. Этой лекцией я, в частности, хочу прояснить то,
что остается "за кадром" DTML кода.
</p>

<p class="head">
   Предупреждение посетителям. Включите, пожалуйста, поддержку
<a href="http://www.w3.org/Style/CSS/">CSS</a> в вашем браузере. Без
<a href="http://css.nu/">CSS</a> сайт выглядит не очень красиво, а
некоторые вещи не работают вовсе, например, подсветка текущего раздела в
горизонтальной навигации.
</p>


<pre>
УСТРОЙСТВО страниц
----------
</pre>

<p>
   Весь сайт совершенно динамический - генерится все, кроме картинок.
Генерится даже <a href="http://zope.phdru.name/main.css">CSS</a>. Этого можно
было бы избежать, сделав CSS-файл статическим, или настроив параметры
кеширования этого объекта (main.css - это экземпляр класса ZStyleSheet),
тем более что этот CSS вызывается во всех страницах... но пока я не вижу
нужды это делать.
</p>

<p class="head">
   Каждая HTML-страница на сайте тоже генерится, и генерится она из
множества объектов.
</p>

<p>
   Каждая страница, очевидно, имеет стандартную обвязку (оформление) и
уникальное содержание. Поэтому каждая страница сайта - это DTML Method
стандартного устройства:

<pre>
   &lt;dtml-var standard_html_header&gt;
      ...здесь содержание страницы...
   &lt;dtml-var standard_html_footer&gt;
</pre>
</p>

<p>
   Это, разумеется, не единственный способ создания страниц, но Зоп в
каком-то смысле навязывает именно его. А именно в том смысле, что когда
верстальщик создает новый DTML Method или Document, standard_html_header и
footer вставляются в текст автоматически. Их можно убрать, конечно.
</p>

<p class="head">
   Некоторые разработчики находят это неправильным. По той причине, что
если верстальщику надо изменить оформление, ему приходится редактировать
header и footer отдельно, что неудобно. Для таких капризных разработчиков
можно придумать следующий способ: в корне сайта ставится Метод index_html с
фиксированным содержанием, у которого оформление и содержание "вывернуты
наизнанку":

<pre>
   &lt;HTML&gt;... и прочее оформление...
   &lt;dtml-var folder_real_content&gt;
   ...и подвал...&lt;/HTML&gt;
</pre>
</p>

<p>
и во всех папках создаются объекты с именем folder_real_content, хранящие
только содержание. При обращении к такой папке будет произведено
заимствование index_html (acquisition!), который заимствуется из корня, и
сам заимствует folder_real_content из текущей папки.
</p>

<p>
   Лично мне такой подход кажется неправильным. Во-первых, сама отсылка на
верстальщика мало помогает. Все равно оформление создается разработчиком из
немалого числа объектов, и уменьшение этого числа на 1 мало чему помогает.
Во-вторых, я теперь не могу создать страницу phd2.html - каждая страница
обязана быть папкой. Неоправданное ограничение.
</p>

<p class="head">
   Поэтому на сайте zope.phdru.name все устроено именно так, как навязывает
Zope.
</p>


<pre>
standard_html_header - с чего начинается каждая страница сайта
--------------------
</pre>

<p>
   Для работы многих объектов на сайте нужны различные переменные - тем или
иным способом разобранный текущий URL. Zope предоставляет большую часть
необходимой информации, но некоторые переменные для упрощения работы я
вычисляю дополнительно. Поскольку они мне нужны на каждой странице, я их
вычисляю в standard_html_header - в DTML Методе, который вызывается из
каждой страницы. Полный код можно посмотреть:
</p>
<p>
   <a href="http://zope.phdru.name/standard_html_header/view_source_pp=1.html">http://zope.phdru.name/standard_html_header/view_source_pp=1.html</a>
</p>
<p>
Здесь я вычисляю URL корня, отделяю его от path, и при необходимости
(установлена переменная text-version) добавляю строку "/text"; это все для
текстовой версии, подробности ниже. Плюс в URLn запоминаю первый объект в
path после корня - это для горизонтальной навигации и тому подобного.
</p>


<pre>
ГОРИЗОНТАЛЬНАЯ НАВИГАЦИЯ (О нас | Python | Zope)
------------------------
</pre>

<p>
   Очень простой DTML Метод global-nav, вызывается из standard_html_header:
<a href="http://zope.phdru.name/global-nav/view_source_pp=1.html">http://zope.phdru.name/global-nav/view_source_pp=1.html</a>
</p>

<p class="head">
   Я проверяю упомянутую URLn, если не index_html - значит рендерится не
корень, и я вставляю в HTML ссылку на корень. Затем по очереди проверяю
каждый из главных подразделов сайта, и подсвечиваю тот из них, в котором
находимся.
</p>

<p class="head">
   Функционирование этой навигационной плашки демонстрируется на следующей
последовательности адресов:<br>

   <a href="http://zope.phdru.name/">http://zope.phdru.name/</a><br>
   <a href="http://zope.phdru.name/About/">http://zope.phdru.name/About/</a><br>
   <a href="http://zope.phdru.name/Python/">http://zope.phdru.name/Python/</a><br>
   <a href="http://zope.phdru.name/Zope/">http://zope.phdru.name/Zope/</a>
</p>


<pre>
ВЕРТИКАЛЬНАЯ НАВИГАЦИЯ (левая колонка сайта)
----------------------
</pre>

<p>
   В самом начале существования сайта я не стал заморачиваться со сложной
левой колонкой. Для начала я хотел, чтобы там был простой список
подразделов текущего раздела, плюс ссылки на другие главные разделы сайта.
Поскольку я хотел их писать в угодном мне порядке, я не стал обходить
дозором сайт, а просто поместил в корень и в главные разделы сайта списки с
именем left-col-list, и левая колонка (left-column) их заимствовала из
текущего контекста. И идею, и способ реализации я подглядел на zope.org:
</p>

<p class="head">
   <a href="http://www.zope.org/Members/phd">http://www.zope.org/Members/phd</a> (см. левую колонку),
   <a href="http://www.zope.org/Members/phd/local_nav/view_source_pp=1.html">http://www.zope.org/Members/phd/local_nav/view_source_pp=1.html</a>
</p>

<p class="head">
   Альтернативным вариантом было бы промаркировать каждую из папок, которую
я хочу поместить в навигацию, каким-нибудь атрибутом (скажем,
left-col-view) и показывать в навигации папки не из заранее заготовленного
списка, а те, у которых этот атрибут установлен. А для сортировки сделать
этот атрибут не булевским, а числовым - весом. Но тогда неудобно
сортировать список папок. Если мне надо поменять местами 2 папки,
приходится открывать множество экранов и редактировать этот атрибут
отдельно. Неудобно, поэтому я так и остался со списком left-col-list.
</p>

<p class="head">
   Через некоторое время существования сайта я решил, что хорошо бы левую
колонку усложнить и сделать покрасивее. Пусть, скажем, корневые (главные)
разделы сайта будут отдельно, а подразделы текущего раздела пусть
вставляются в середину списка, да еще с отступом. Очень не хотелось
дублировать информацию (то есть чтобы каждый left-col-list содержал в себе
еще и пункты предыдущего уровня) - слишком сложно было бы для
редактирования. Устройство данных и алгоритм вполне очевидны - надо
просканировать все поддерево сайта от корня до текущей папки, найти все
left-col-list и объединить их в иерархическую структуру - каждый
left-col-list ищет себе место в предыдущем уровне. Написать такую
конструкцию на DTML... наверно, можно было бы, но сложно. Тут в первый раз
за все время существования сайта я обратился к Python и написал External
Method. Вот его код:
</p>
<p>
   <a href="http://zope.phdru.name/Zope/navigation_left_column">http://zope.phdru.name/Zope/navigation_left_column</a>
</p>
<p>
Там простая рекурсивная функция default_render, которая обегает полученную
структуру и рендерит ее в HTML, и собственно метод navigation_leftColumn
обхода сайта от корня. В процессе его создания я столкнулся с
необходимостью выключить acquisition - в данном случае он оказался
излишним, ведь я хочу получать реальные left-col-list в их соответствующих
папках, а никак не заимствованные! Очень хорошо, никаких проблем, Zope
позволяет сделать и это. Я проверяю наличие объекта не в parent, а в
parent.aq_explicit - подобъекте, в котором заимствование в точности
выключено. После чего ренедерю DTML-объект left-col-list в питоновский
список - для этого DTML-объект надо вызывать, передав параметрами текущий
контекст: leftcol_list(self,&nbsp;_), и простым циклом ищу, куда бы этот список
залинковать на предыдущем уровне.
</p>

<p class="head">
   Кончается все вызовом функции render. Сначала это был default_render, а
потом я ее переписал на DTML, чтобы легче было редактировать:
</p>
<p>
   <a href="http://zope.phdru.name/navigation_lcRender/view_source_pp=1.html">http://zope.phdru.name/navigation_lcRender/view_source_pp=1.html</a>
</p>
<p>
В результате левая колонка свелась к простому коду
</p>
<p>
   <a href="http://zope.phdru.name/left-column/view_source_pp=1.html">http://zope.phdru.name/left-column/view_source_pp=1.html</a>
</p>
<p>
представляющему собой HTML-обрамление вызова navigation_leftColumn.
</p>

<p class="head">
   Функционирование левой колонки демонстрируется на следующей
последовательности адресов:<br>

   <a href="http://zope.phdru.name/">http://zope.phdru.name/</a><br>
   <a href="http://zope.phdru.name/Python/">http://zope.phdru.name/Python/</a><br>
   <a href="http://zope.phdru.name/Zope/">http://zope.phdru.name/Zope/</a><br>
   <a href="http://zope.phdru.name/Zope/HOWTO/">http://zope.phdru.name/Zope/HOWTO/</a>
</p>

<p class="head">
На любом уровне можно посмотреть содержимое left-col-list, например:
   <a href="http://zope.phdru.name/Zope/left-col-list/view_source_pp=1.html">http://zope.phdru.name/Zope/left-col-list/view_source_pp=1.html</a>
</p>


<pre>
ВЕРСИЯ ДЛЯ ПЕЧАТИ и текстовая версия
-----------------
</pre>

<p>
   На сайте, в объекте standard_html_footer есть ссылки на текстовую версию
сайта и версию страницы для распечатки:
</p>
<p>
   <a href="http://zope.phdru.name/standard_html_footer/view_source_pp=1.html">http://zope.phdru.name/standard_html_footer/view_source_pp=1.html</a>
</p>

<p class="head">
   Изначально существовала только версия для распечатки. Реализована она
крайне просто - в URL передается параметр pp (printable page), затем
ZPublisher вводит эту переменную в пространство имен (в Zope это делается
автоматом), а в standard_html_header/footer ее значение (на самом деле
просто присутствие и отличие от нуля) проверяется. В случае отсутствия pp
(или нуля) генерится полная версия страницы, со всем оформлением, а в
случае присутствия - генерится страница только с содержанием, без
оформления:<br>

   <a href="http://zope.phdru.name/standard_html_header/view_source_pp=1.html">http://zope.phdru.name/standard_html_header/view_source_pp=1.html</a><br>
   <a href="http://zope.phdru.name/standard_html_footer/view_source_pp=1.html">http://zope.phdru.name/standard_html_footer/view_source_pp=1.html</a>
</p>

<p class="head">
   Затем один из членов нашей Группы, Денис Откидач, предложил добавить еще
специальную текстовую версию. Отличие от версии для печати - в ссылках. В
версии для печати все ссылки ведут на страницы с оформлением. А в текстовой
версии все ссылки должны вести опять-таки на текстовые версии страниц.
</p>

<p class="head">
   Реализация текстовой версии прошла несколько этапов. Самым первым был
вариант, когда средствами Апача все адреса http://zope.phdru.name/text/(.*)
переписывались в http://zope.phdru.name/$1 с добавлением упомянутой переменной
pp&nbsp;:) Это не вполне работало, потому что ссылки все еще были "не туда".
</p>

<p class="head">
   Нынешняя реализация проста до неприличия за счет использования
acquisition. В корне сайта создана папка /text. Она совершенно пуста. Это
ничему не мешает. Если рендерится http://zope.phdru.name/ - то вызовется
корневой index_html, а если рендерится http://zope.phdru.name/text/ - то этот
index_html позаимствуется из корня.
</p>

<p class="head">
   В чем тогда суть? А суть в том, что папке /text приписаны 2 атрибута -
pp и text-version. Благодаря переменной pp Метод index_html, заимствованный
из http://zope.phdru.name/text/ будет рендерится без оформления (переменная pp
в данном случае заимствуется из /text, а не передается через URL), в
отличии от непосредственного вызова http://zope.phdru.name/. А переменная
text-version является флагом, благодаря которому standard_html_header
добавит строку "/text" к переменной VirtualRoot. Ну и остается пройтись по
сайту и заставить все ссылки на корень рендерится через VirtualRoot - тогда
все ссылки в текстовой версии будут опять-таки вести на URL с префиксом
"/text": <a href="http://zope.phdru.name/text/">http://zope.phdru.name/text/</a>
</p>


<pre>
ПОИСК
-----
</pre>

<p>
   В Zope есть встроенный механизм поиска - ZCatalog. Он не работает с
морфологией, не ищет по регулярным выражениям. Что-то вроде htDig, к
которому не прикрутили морфологию. Но! Есть у Z-Каталога одно большое
достоинство - тесная интеграция с Zope. Я могу индексировать только
определенные объекты, по дате, могу ограничиться только объектами, для
которых у роли X есть право доступа Y и т.п. Кроме того, после индексации
объекты сами говорят своим каталогам "я изменился - переиндексируй меня", о
чем в htDig приходится только мечтать. Аналогично и при добавлении новых
объектов и удалении старых - они посылают сообщение каталогу. Точнее, могут
посылать - для этого их классы надо наследовать от CatalogAware.
</p>
<p>
   Для начала работы надо добавить на сайт экземпляр или несколько
экземпляров класса ZCatalog. Я добавил 1 в корень, и назвал его
search-catalog. Затем сайт первый раз индексируется. Я проиндексировал
полностью все объекты, у которых Anonimous имеет право View - хочу сделать
публичный поиск. В процессе индексации Z-Каталог создает несколько
индексов. Какие именно - дело менеджера. Я не стал менять умолчания, и
поэтому у меня создались:
</p>

<ul>
   <li>текстовый индекс для полнотекстового поиска по содержанию</li>
   <li>текстовый индекс для поиска по атрибуту title каждого объекта</li>
</ul>

<p>
   и еще несколько, которые здесь неинтересны.
</p>

<p class="head">
   Форму для поиска я загнал в отдельный мелкий Метод
<a href="http://zope.phdru.name/search-form/view_source_pp=1.html">http://zope.phdru.name/search-form/view_source_pp=1.html</a>,
для того, чтобы иметь одну копию формы (с параметрами - показывать ли кнопку
"Искать", и размер поля ввода), а саму форму вставлять в разные места.
</p>
<p>
   Первое место, где эта форма используется - отдельная страница поиска
<a href="http://zope.phdru.name/search/">http://zope.phdru.name/search/</a>. Устроена она просто:
</p>
<p>
   <a href="http://zope.phdru.name/search/view_source_pp=1.html">http://zope.phdru.name/search/view_source_pp=1.html</a>.
Стандартное оформление плюс вызов упомянутого Метода с параметром "показать
кнопку".
</p>

<p class="head">
   Сам поиск реализован на DTML же... ну то есть на DTML написан вызов
Z-Каталога и оформление результатов:
</p>
<p>
   <a href="http://zope.phdru.name/search-results/view_source_pp=1.html">http://zope.phdru.name/search-results/view_source_pp=1.html</a>.
</p>
<p>
Сначала я получаю ссылку на сам объект каталог:
catalog=_.getitem('search-catalog',&nbsp;0), затем проверяю, был ли передан в
форме параметр text_search. Если да - делаю 2 поиска по каталогу - по
содержимому текстов (индекс PrincipiaSearchSource) и по заголовкам (индекс
title). Результаты двух поисков склеиваю - это такой способ выполнить
операцию OR. Операция AND поддерживается в таком виде: catalog(id="index_html",&nbsp;title="Python").
О памяти/скорости не беспокоюсь - ZCatalog полностью поддерживает lazy
evaluation, и даже суммирование результатов не заставляет его грузить в
память все объекты.
</p>
<p>
   Если text_search не было - просто делаю пустой запрос к каталогу; при
этом найдутся все объекты.
</p>
<p>
   Ну и выдача результирующего HTML - простой цикл по списку результатов с
разбивкой на страницы.
</p>

<p class="head">
   Текстовая версия тоже работает. Работает как переход их полной версии в
текстовую, так и версия для распечатки, причем ссылки из текстовой версии
результатов поиска честно ведут на текстовые версии документов. Я почему
это подчеркиваю? Да потому что я потратил на текстовую версию не больше
полчаса, и с тех пор пользуюсь результатами. Плюс еще минут 10 я потратил,
чтобы передать запрос на странице результатов поиска в ссылки на текстовые
и печатные версии.
</p>


<pre>
НОВОСТИ и импорт новостей
-------
</pre>

<p>
   Самой активной, часто меняющейся частью сайта являются разделы
импортируемых новостей. Новости импортируются из источников по Питону и Зоп
(плюс несколько других, менее интересных). Поток новостей идет в формате
RSS 0.91. Разбором приходящего XML занимается компонент RSS Channel, он же
и хранит список элементов потока, плюс простые DTML Методы для оформления
результатов.
</p>
<p>
   Импорт осуществляется по команде программы, запускающейся из cron
несколько раз в сутки. Сейчас сайт хостится в Питере, у провайдера
<a href="http://square.spb.ru/">http://square.spb.ru/</a>, программы
запускаются в Москве и обращаются к сайту по HTTP. Это один из двух главных
протоколов RPC, по которому можно обратиться к Zope (второй - это, конечно,
XML-RPC).
</p>

<p class="head">
   Новости показываются в правой колонке сайта, кроме корня. В корне
новости показывает корневой index_html:
   <a href="http://zope.phdru.name/index_html/view_source_pp=1.html">http://zope.phdru.name/index_html/view_source_pp=1.html</a>
В правой колонке новости показывает сам объект right-column:
   <a href="http://zope.phdru.name/right-column/view_source_pp=1.html">http://zope.phdru.name/right-column/view_source_pp=1.html</a>
Он создает HTML-оформление для right-col-news и показывает на каждой
страницу стандартную картинку Zope. Сам он вызывается из
standard_html_footer.
</p>

<p class="head">
   Если объект right-column на сайте один - в корне, то объектов с именем
right-col-news несколько - в корне и в каждом из главных разделов сайта.
Когда right-column рендерится, он заимствует нужный right-col-news из
текущего контекста. Так что при желании можно переопределить содержание
этой колонки в любом разделе:<br>
   <a href="http://zope.phdru.name/Python/right-col-news/view_source_pp=1.html">http://zope.phdru.name/Python/right-col-news/view_source_pp=1.html</a><br>
   <a href="http://zope.phdru.name/Zope/right-col-news/view_source_pp=1.html">http://zope.phdru.name/Zope/right-col-news/view_source_pp=1.html</a>
</p>


<pre>
MAINTAINANCE (backup, pack Data.fs)
------------
</pre>

<p>
   Каждый сайт требует какого-то обслуживания, регулярной чистки,
резервного копирования и т.п. Наиболее просто в Zope делается backup. Зоп
позволяет проэкспортировать любой объект (вплоть до корня ZODB). Экспорт
может сделать в файл ZEXP (внутренний формат ZODB) или XML. Любой из
экспортных файлов потом импортируется назад, при необходимости. Более того,
формат ZODB и ZEXP полностью переносим между всеми платформами и ОС. Можно
проэкспортировать сайт с NT на AMD и проимпортировать на спарковый Солярис!
Экспортный файл можно получить по сети (по HTTP) или сохранить в файловой
системе сервера. Я запускаю backup из cron раз в неделю, экспортирую весь
сайт в ZEXP (до создания поиска файл занимал 300K, вместе с каталогом он
теперь чуть больше мегабайта), получаю его по HTTP и складываю на своей
машине. Время от времени я запускаю backup руками - для того чтобы получить
самую свежую версию и положить ее на локальный сервер для отладки.
</p>

<p class="head">
   Второй процесс, уже не относящийся непосредственно к сайту - упаковка
файла Data.fs. Файл этот - физическое представление ZODB с хранилищем
FileStorage. Достоинство этого хранилища - простота. Zope, поставленный из
дистрибутива, работает именно с этим хранилищем. Есть и другие хранилища -
BerkeleyStorage и пр. Их недостаток - отсутствие Undo и Версий. Есть
хранилища типа InformixStorage и OracleStorage, поддерживающие Undo и
Версии, но они требуют соответствующих SQL-серверов. Зато они не растут, как
Data.fs, и не требуют упаковки. Хранилища без Undo тоже не растут.
</p>
<p>
   Я пользуюсь FileStorage. Это хранилище держит всю ZODB в одном файле
Data.fs (плюс индекс Data.fs.index, что здесь совершенно неважно). Файл
этот растет - все транзакции FileStorage дописывает только в конец файла.
Поэтому время от времени следует избавляться от старых транзакций -
упаковать файл. Команда Pack в Зоп требует вещественного параметра - число
дней, за которые оставить транзакции в базе. Я делаю упаковку раз в неделю,
в понедельник ночью, оставляя транзакций за последние 3 дня. Это позволяет
мне в понедельник утром сделать Undo операции, которую я совершил в
пятницу. Команду Pack я также, конечно, вызываю из cron, по HTTP.
</p>


<pre>
РЕЗЮМЕ и планы на будущее
------
</pre>

<p>
   В своем классе продуктов - сервера web приложений (web application
servers) - Zope не уникальный продукт, но обладающий массой достоинств,
которыми он меня привлек, и я использую Zope со все большим удовольствием.
Тем более что разработчики Zope весьма открыты, и немало моих собственных
патчей, и патчей, сделанных по моей просьбе, вошло в код.
</p>

<p class="head">
   Чего не хватает именно на нашем сайте - внятной content-модели,
устройства документов. План, соответственно, таков - создать, или взять
готовые, или довести до ума полуготовые Z-Классы, описывающие устройство
документа (заголовок - содержание - автор - дата публикации - и т.п.), и
перевести все нынешние простые документы в эту структуру. Проиндексировать
Z-Каталогом по отдельным полям. Это позволит, например, запросить каталог
"дай список всех авторов" (то есть уникальных входов в индекс author) и
создать страничку "Все авторы", со ссылками на публикации каждого автора. В
будущем, если количество авторов, пишущих для сайта, станет велико, можно
будет создать полноценную CMS (content management system).
</p>

<dtml-var standard_html_footer>