ИнфоРост
информационные технологии для архивов и библиотек
26 / 38
Главная Публикации, выступления, исследовательские проекты, рабочие записки... Кирилл Фесенко. Вновь открывая российскую национальную библиографию...

Кирилл Фесенко. Вновь открывая российскую национальную библиографию. Библиография. 2006. ­ N 6. ­ С. 11-­14

Вновь открывая российскую национальную библиографию [Текст] / К. Фесенко ; пер. М. К. Сухоруков // Библиография. ­ 2006. ­ N 6. ­ С. 11-­14 

Национальные библиографические указатели (летописи) являются самыми полными и авторитетными записями о российской издательской деятельности. Они отражают национальное интеллектуальное наследие и даже «духовные силы» страны, как это было в своё время провозглашено первым директором Российской книжной палаты С.А. Венгеровым. Выход летописей происходит по следующему принципу: российские издатели, согласно федеральному закону «Об обязательном экземпляре документов», обязаны высылать копии всех своих новых публикаций, включая сериальные издания, в Российскую книжную палату (РКП). Последняя служит одним из нескольких государственных хранилищ обязательных экземпляров издательской продукции, будучи главным архивом российской печатной документации. Библиографические записи обработанных обязательных экземпляров затем печатаются в летописях – это десять серийных изданий, специализированных по следующим категориям: книги, периодика, газетные и журнальные статьи, диссертации, рецензии, графические издания, музыкальные, картографические, библиографические указатели. Компания Ист Вью (East View Information Services) занимается распространением летописей на Западе в течение многих лет, и опыт показывает, что они относятся к наиболее популярным изданиям, заказываемым фондами славистики различных библиотек. Летописи играют роль одного из главных источников для справочно-библиографического обслуживания и мониторинга текущих публикаций.

Охватывая важнейшие текстовые и нетекстовые печатные материалы, летописи отражают издательские тенденции в России и используются для исследований во всех областях знания. Некоторые информативные качества летописей делают их особо полезными. К примеру, «Книжная летопись» обеспечивает предметный доступ к записям 80–85% всех книг, изданных в России и имеющих тираж более 100 экземпляров, включая книжные серии и продолжающиеся издания. Однако некоторые материалы включены в эти указатели независимо от их тиражей: научные публикации (материалы конференций, публикации научно-исследовательских и образовательных институтов и т. д.), художественная и детская литература. Таким образом, «Книжная летопись» может использоваться как уникальный источник сведений о малотиражной литературе. «Летопись журнальных статей» также предоставляет доступ к отдельным статьям из более чем 3000 журналов научно-технической и гуманитарной тематики. Она особенно полезна как в качестве информационного ресурса об авторитетных «Трудах» Российской академии наук и её региональных представительств, научных и технологических институтов, работах, выпущенных музеями и библиотеками. «Летопись авторефератов диссертаций» – один из наиболее полных и оперативных источников по кандидатским и докторским диссертациям. «Летопись периодических и продолжающихся изданий» – ещё один чрезвычайно полезный ресурс, охватывающий историю публикации тысяч российских центральных и региональных газет, журналов, продолжающихся изданий и сборников работ (более подробную информацию см. на веб-сайте Эллен Саливан: http://www.library.uiuc.edu/spx/class/nationallib/natbibrussia.html).

Несмотря на исключительную ценность летописей как источника информации, исследователи и библиотекари, как правило, сходятся во мнении, что пользоваться печатной версией чрезвычайно неудобно. Наиболее популярные летописи – книжные, газетных и журнальных статей – публикуются еженедельно, и работа с их бумажными версиями требует много сил и времени, если необходимо, например, исследовать какую-то тему за несколько лет или найти работы конкретного автора. К тому же указатели часто приходят к подписчикам с опозданием, требуют долгой обработки и занимают много места на книжной полке. Неудивительно, что во время всеобщего перехода на электронные носители библиотекари отмечают значительное уменьшение использования печатных летописей, хотя пока не создано ни одной адекватной им замены в других форматах. Поэтому обеспечение онлайнового доступа к этим записям показалось удачным способом преодоления недостатков печатных библиографических указателей.

Руководствуясь этими мыслями, компания Ист Вью обратилась к Книжной палате с идеей о создании электронной базы данных летописей, и после продолжительных переговоров был подписан контракт на преобразование печатных летописей в цифровой формат и предоставления к ним онлайнового доступа для подписчиков. Передача такого рода прав – непростое решение для любого издателя, но в пользу Ист Вью сыграл тот факт, что компания сотрудничает с РКП по распространению летописей начиная с начала 1990-х гг. и уже накопила необходимый опыт как в этой области так и в области создания полнотекстовых баз данных. Положительную роль сыграла и хорошая репутация Ист Вью как надёжного партнёра сотен других российских издателей в области оцифровки и предоставления услуг по подписке в режиме онлайн. Основной идеей этого проекта было создание библиографической базы данных, которая бы вобрала в себя лучшие характеристики летописей в печатном формате (содержания с разбивкой по темам, вспомогательные указатели, регулярное обновление и др.), и предоставление исследователям возможности просматривать миллионы записей через многообразие связей между ними и проводить поиск по ключевым словам.

Как это происходит с любым большим проектом, на начальной стадии реализации были некоторые сомнения и проблемы. Хотя компания Ист Вью уже имела успешный опыт составления больших полнотекстовых баз данных по газетным и журнальным статьям, графическим и статистическим таблицам, всё-таки это был первый проект, касающийся исключительно библиографической информации. Очень скоро стало ясно, что построение  информационной платформы для значительного массива библиографических записей является более сложной работой по сравнению, например, с уже сделанными нами базами данных для газетных и журнальных статей. Во-первых, библиографические записи летописей являются более сложными структурами по сравнению, например, с газетной статьей – они содержат больше полей (например, «Книжная летопись» содержит 17 полей для записей), которые изменяются в зависимости от типа летописей. Во-вторых, библиографическая база данных требует развитой системы точек доступа, в то время как полнотекстовые базы данных часто ограничиваются поисковой системой по ключевому слову и просмотру отдельных заглавий, выпусков и статей. Особенно трудно было обеспечить последовательный доступ к записям летописей через систему, основанную на УДК, так как предметные рубрики время от времени меняются. И в-третьих, электронные записи, которые были получены из РКП, содержали некоторые ошибки и сокращённые заглавия многих серийных названий, имён издателей и мест публикации.

Группе разработчиков потребовалось шесть месяцев, чтобы выпустить «Версию 1.0» Российской библиографической базы данных. В период подготовки дизайна и прототипа системы было важно сохранить максимально простыми и удобными для пользователей интерфейс и навигацию по базе данным и записям. С другой стороны, эти же интерфейсы должны предоставлять расширенную систему точек доступа к записями и раскрывать богатство взаимосвязей между ними. Наконец, архитектура системы и ее интерфейсы должны предусматривать возможность их относительно легкого изменения в будущем—ведь область электронных информационных технологий проходит сейчас период бурного роста. Когда база данных была, наконец, сформирована, она включала 1,3 млн библиографических записей, взятых из всех серий летописей начиная с 1998 г. Эти записи доступны для поиска и просмотра на русском языке и в транслитерации (на латинице). Простой и продвинутый поисковые интерфейсы позволяли выводить поисковые результаты, используя булеву логику, дату и тип публикации, тему и поля записей. Описываемая база данных также предоставляла «межлетописные» тематические, авторские и серийные указатели для просмотра записей по 635 предметным рубрикам, более чем 600 тыс. авторам и 3700 сериальных названий.

Российская национальная библиографическая база данных впервые была представлена на конференции Американской ассоциации по развитию славистических исследований (American Association of Advanced Slavic Studies или AAASS) в Торонто, где её весьма положительно приняли библиотекари и исследователи. Однако вместе с положительными оценками работы высказывались рекомендации для улучшения баз данных. Этот «лист пожеланий» разрастался по мере того, как всё большее количество библиотекарей тестировало продукт и подписывалось на него. Среди наиболее актуальных предложений были следующие: конвертировать сокращённые названия серий в полные для облегчённого поиска по ключевому слову; добавить больше предметных рубрик к индивидуальным записям и к предметному дереву каталога; улучшить навигацию по длинному авторскому списку и списку заглавий серий; предоставить доступ к отдельным выпускам летописей с навигацией по содержанию номера. Некоторые из этих идей требовали внесения изменений в интерфейс, другие – структурной и содержательной переработки библиографических записей РКП.

Первой проблемой, решением которой компания Ист Вью начала незамедлительно заниматься, явились сокращённые названия серий. Как и названия издательств и мест изданий, они сокращались персоналом Книжной палаты, чтобы сделать записи короче для публикации в печатных летописях. В онлайновой среде аббревиатуры создавали очевидные проблемы для поиска по ключевому слову. Программисты компании разработали специальный конвертер, который считывал сокращения и преобразовывал их в полные названия, используя собственный словарь. Отныне все записи сначала обрабатываются данной программой и только затем поступают в базы данных. Следующим шагом должно было стать добавление предметных рубрик к индивидуальным записям, чтобы сделать предметные описания более понятными и поднять эффективность поиска по ключевому слову. В процессе исследования этого вопроса было сделано интересное открытие: каталогизаторы РКП присваивают классификационные коды УДК и их комбинации к библиографическим записям для книг, газетных и журнальных статей, рецензий, диссертаций и карт. Эти коды УДК, соединенные вместе логическими операторами и расширенные путем добавления кодов вспомогательных терминов, отражают многообразцией тематических связей для конкретной работы. Хотя индексы УДК и их комбинации присутствуют в соответствующих  летописях, они обычно игнорируются пользователями, которые не могут расшифровать их значение, выраженное в цифрах и логических операторах. Разработчики Ист Вью создали конвертер, который переводит значение индексов УДК и их комбинаций обратно на русский и английский языки. Эти тематические заголовки добавили значительное количество информации к описаниям из оригинальных летописей и стали доступны для поиска по ключевым словам на обоих языках в тематическом поле поиска. Дальнейшее развитие тематического доступа к индивидуальным записям возможно по нескольким направлениям: (1) путем расшифровки вспомогательных терминов, используемых вместе с индексами УДК (язык, форма, место, люди и личные характеристики, время, этническая принадлежность, национальность и т. д.); (2) добавления рубрик УДК, используемых в содержании печатных летописей, непосредственно к соответствующим индивидуальным библиографическим записям; а также (3) добавления новых предметных рубрик к “тематическому дереву”, которое показывает тематический охват и иерархию библиографических записей, а также их количество в базе данных.

 В число других улучшений, над которыми работает Ист Вью, входит усовершенствование интерфейса для авторского указателя и указателя серийных изданий, а также добавление возможности просмотра записей по содержанию отдельных выпусков летописей. Желательным было бы и добавление аннотации к записям «Книжной летописи». Это углубит их описания и повысит эффективность поиска по ключевым словам.

Здесь интересным представляется тот факт, что Книжная палата в течение многих лет ведёт базу данных по аннотациям, но они никогда не добавлялись к записям в печатных летописях по экономическим причинам. Учитывая важность Российской национальной библиографический базы данных, Ист Вью и РКП работают вместе над тем, чтобы текущие летописные записи загружались в базу и становились доступными подписчикам на месяц раньше, чем в печатных изданиях. В результате текущих и будущих проектов по оцифровке печатных летописей, пользователям также станут доступны ретроспективные библиографические записи. В конечном счёте хотелось бы интегрировать Российскую национальную библиографическую базу данных в другие полнотекстовые базы данных компании Ист Вью, чтобы библиографические записи были непосредственно связаны с теми документами, которые они представляют.

Несмотря на технические сложности проекта и большой «список пожеланий» по его усовершенствованию, Российская национальная библиографическая база данных уже сейчас предоставляет более эффективный доступ к записям летописей по сравнению с печатным изданием. Она используется в крупнейших библиотеках США и Великобритании, и поддержка этому проекту со стороны РКП, библиотекарей и исследователей не может не радовать. Онлайновый доступ к электронным записям летописей по-новому раскрывает их ценное содержание и предоставляет исследователям принципиально новые возможности для работы с этим важным источником информации. До появления электронной версии, к печатным летописям иногда обращались в последнюю очередь в силу неудобства использования бумажной версии, особенно если требуемую информацию нужно было найти быстро. Вполне вероятно что теперь электронные летописи могут приобрести статус наиболее популярного информационного источника для широкого круга пользователей. Усовершенствованный доступ к этим надёжным и авторитетным библиографическим записям будет способствовать развитию исследований в области славистики и повышению использования библиотечных коллекций.