ИнфоРост
информационные технологии для архивов и библиотек
13 / 40
Main Publications, presentations, research papers Онлайн-платформа ИнфоРост для архивов и библиотек. Актуальность про...

Онлайн-платформа ИнфоРост для архивов и библиотек. Актуальность проблем оцифровки и публикации библиотечных фондов и архивных документов в Интернете (Кирилл Фесенко, 2015)

Задача оцифровки уникальных исторических документов и библиотечных фондов как с целью их сохранения для потомков, так и для не менее важной сегодня задачи оперативной публикации в открытый доступ в Интернете стоит особенно остро для архивов и библиотек. Современное общество активно обсуждает и переосмысливает события истории, полагаясь на Интернет в качестве основного источника информации и канала коммуникации, а формирующаяся международная информационная среда все более остро ставит вопрос об обеспечении доступа и введении в информационный оборот возможно большего числа первоисточников.

Ежегодно в стране происходят юбилейные события, архивные документы о которых требуют освещения в СМИ, и особенно - в Интернете. Такие приближающиеся знаковые юбилеи как 70 лет Победы в Великой Отечественной войне, 50-летие первого выхода человека в открытый космос (18 марта 2015 г.), 100 летие Великой октябрьской социалистической революции и другие неизбежно вызывают всплеск общественных обсуждений и осмысления истории в свете сегодняшнего дня. Все это постоянно повышает объективную потребность общества в доступе к историческим первоисточникам.

Благодаря растущему количеству проектов по оцифровке, исторические материалы, ранее доступные ограниченному числу исследователей, сегодня становятся свободны для ознакомления любому пользователю с Интернет-доступом. Это особенно важно в условиях, когда изучение и обсуждение истории и ее связи с проблемами современности приобрело массовую популярность в СМИ, блогах, социальных сетях, профессиональных и любительских веб-сайтах. Ссылки на оцифрованные первоисточники и исторические издания активно размещаются в википедиях, электронных каталогах, учебных материалах для студентов, академических публикациях в Интернете, и т.д.

Все это стало плодотворной основой для развития “Цифровых гуманитарных наук” (Digital Humanities) -- новой отрасли знаний на стыке информационных и гуманитарных наук, и междисциплинарных исследований в целом.

 


Соревнование электронных библиотек и роль технологии

 

Архивы и библиотеки во всем мире соревнуются в деле оцифровки и публикации коллекций в Интернете. Наилучший результат показывают организации, сумевшие перейти от старой “проектной” (разовой, дискретной) модели оцифровки коллекций к поточной на основе долгосрочной программы. При таком прогрессивном подходе отбор материала для оцифровки, его обработка и онлайн-публикация происходят не от проекта к проекту, а становятся такой же постоянной частью работы библиотеки как, например, комплектование или каталогизация фондов. Организации добиваются этой цели благодаря, в частности, внедрению более совершенных технологий, ускоряющих и упрощающих процесс публикации коллекций.

см. также:


О проблемах оцифровки и развития Российского сектора цифровых гуманитарных наук

 

Несмотря на усилия государства в последние годы по стимулированию оцифровки и улучшению доступа к важным архивным и библиотечным коллекциям по Интернету, темпы и качество соответствующей работы в организациях явно не соответствуют современным требованиям.

Отечественные коллекции отстают от стран с развитыми архивно-библиотечными информационными системами на 10-15 лет как по оснащенности современными технологиями для электронных библиотек, так и по объемам публикуемого в Интернете материала. Также в отставании находится пока еще новая для России область “Цифровых гуманитарных наук”, которая подразумевает использование исследователями продвинутых информационных технологий для работы с оцифрованными коллекцими.

Серьезным препятствием к прогрессу здесь служит отсутствие современного российского программного обеспечения для электронных библиотек на открытом коде. Также следует отметить порой слабое понимание в организациях методологических основ создания и требований к электронным ресурсам. В результате появляются электронные коллекции на морально устаревших технологиях в то время, когда широкому кругу пользователей нужны простые интерфейсы, интуитивная навигация и современная функциональность. А исследователям-специалистам  -- еще и удобные инновационные иструменты для работы с оцифрованными коллекциями.

Как убедительно показывает практика, пользователи, следуя “Правилу наименьшего усилия”, прежде всего выбирают на Интернете источники информации с простыми интерфейсами и интуитивной навигацией. Качество самого контента, при этом, как правило отходит для пользователя на второй план по сравнению с удобством и легкостью использования интерфейсов для электронных коллекций. Российскому архивно-библиотечному сообществу важно осознать это краеугольное требование эффективной публикации исторических документов в Интернете.  

Поэтому главной целью создания латформы ИнфоРост стало оказание технологической  поддержки в этих вопросах архивам и библиотекам, заинтересованным активно развивать свои электронные коллекции и экспериментировать в области электронной публикации и создания современных технологичных цифровых продуктов.

 


Чем платформа ИнфоРост полезна архивам и библиотекам

 

Платформа ИнфоРост является универсальной электронной библиотекой, позволяющей предоставлять читателям доступ к оцифрованным коллекциям по Интернету и в локальных сетях организаций.

Универсальность платформы выражается в том, что она предоставляет библиотекарям широкий набор инструментов по созданию и настройке электронных коллекций в соответствии с индивидуальными требованиями организации и ее пользователей.

Технология позволяет оперативно размещать в Интернете:

  • книги, журналы и газеты;

  • архивные документы;

  • карты и иллюстрации с высокой степенью увеличения деталей;

  • библиографические записи;

  • фото, видео и аудио материалы;

  • виртуальные выставки.

С помощью платформы можно также создавать виртуальные коллекции и веб сайты.

Архитектура платформы оптимизирована для поддержки оцифровки в архивах и библиотеках и cоздания крупных электронных коллекций в поточном режиме. Платформа позволяет делать залповую загрузку больших уже оцифрованных коллекций единовременно или загружать 2 тысячи и более страниц документов ежедневно в ручном режиме.

Важной особенностью технологии является то, что библиотекарь или архивист-администратор имеет возможность самостоятельно настраивать работу электронных коллекций с помощью простых административных экранов и меню инструментов, работа с которыми не требует специальных технических навыков. Обширный набор административных возможностей позволяет библиотекарю, среди прочего:

  • конструировать пользовательские экраны, графические стили и функциональность  электронной библиотеки;

  • определять режимы доступа к материалам (открытый или закрытый по паролю/IP адресу);

  • создавать экраны-формы для ввода описаний и шаблоны метаданных;

  • налаживать работу информационно-поискового аппарата;

  • получать развернутую статистику использования электронных ресурсов, и т.д.

Платформа может устанавливаться для работы в облачном окружении и на локальных серверах организаций.

 


Примеры и опыт использования

 

С момента полного завершения технической отработки  платформы ИнфоРост (середина 2013 г.) было опубликовано более 5 миллионов страниц материалов из архивных и библиотечных коллекций. Среди наиболее крупных, активно развивающихся проектов, можно выделить следующие:

 


Открытая электронная библиотека Государственной публичной исторической библиотеки (ГПИБ) (http://elib.shpl.ru/)

 

За год с небольшим с момента выпуска в свет Открытой электронной библиотеки осенью 2013 года, коллектив ГПИБ успешно встроил производственный процесс поточной оцифровки изданий и их размещения в Интернете в будничную работу организации. Загрузка изданий в электронную библиотеку и их описание происходят на ежедневной основе. Сотрудники библиотеки регулярно информируют читателей о поступлении новых материалов и предоставляют им возможность наблюдать за процессом обработки изданий в режиме реального времени (http://elib.shpl.ru/ru/indexes/types/32).

 

Коллектив библиотеки также регулярно размещает информацию о новых электронных поступлениях в социальных сетях Фэйсбук, В контакте и Живом Журнале. На этих же площадках библиотека ведет с читателями обсуждение идей и приоритетов в области оцифровки коллекций. Живой диалог с пользователями и эффективные технологии позволяют коллективу постепенно оттачивать подходы к выбору материала для текущей публикации в Интернете и планирования на перспективу.

В качестве показателей работы ГПИБ за прошедний период (1 октября 2013 г. по 31 января 2015 г.), можно привести следующие данные:

  • Всего опубликовано страниц: 1,520,000 (включая более 4,500 книг и 150 журнальных и газетных изданий);

  • Количество ежедневных посетителей увеличилось в 6 раз с приблизительно 100 сразу после открытия электронной библиотеки осенью 2013 г. до 600 ежедневных пользователей в январе 2015 г. (отметка в 1000 и более ежедневных пользователей достигнута летом 2015 г.):

  • Ежедневно с электронной библиотекой работают пользователи из 40 стран;
  • Всего пользователи из 128 стран мира просмотрели материалы библиотеки более миллиона раз​ в течение одного года.

 

Таблица справа показывает 10 стран с наибольшим количеством сессий по информации из Google Analytics


Российско-германский проект по оцифровке германских документов в архивах Российской Федерации (http://www.germandocsinrussia.org/)

 

Проект осуществляется при поддержке Российского исторического общества, Федерального архивного агентства, Германского исторического института и Министерства обороны РФ. За время существования проекта с 2013 года в его рамках были оцифрованы и опубликованы на платформе более 120,000 страниц трофейных германских документов из фондов Российского государственного архива социально- политической истории (РГАСПИ) и Центрального архива Министерства обороны Российской Федерации (ЦАМО):

 

Коллекция документов спецслужб Германии 1912-1945 гг. (РГАСПИ, Фонд 458, Опись 9): 

http://rgaspi-458-9.germandocsinrussia.org/

Германские документы Первой и Второй Мировых войн. (ЦАМО РФ. Фонд 500):

http://tsamo.germandocsinrussia.org/ru/nodes/2

http://wwii.germandocsinrussia.org/

В данном проекте в единый производственный процесс связаны сканирующее оборудование в архиве и платформа, что позволяет дистанционно по Интернету обрабатывать, описывать и публиковать отсканированные документы.

Процесс происходит поточным образом -- оцифрованные документы, полученные с использованием высокоскоростных сканеров, загружаются на онлайн-платформу по мере их поступления от группы сканирования. С этого момента сканы документов становятся доступны по Интернету, что позволяет дистанционным операторам приступить к проверке их качества и подготовке к публикации, а историкам-экспертам - к описанию документов. Плюсом работы в режиме онлайн является и то, что руководство проекта получает возможность наблюдать за качеством и скоростью работы всех его участников в режиме реального времени.

 


Инновационные возможности

 

Важной особенностью платформы является гибкость и масштабируемость ее архитектуры. Это позволяет организациям оперативно совершенствовать интерфейсы и функциональность электронных коллекций, необходимость в чем постоянно растет, а также использовать платформу в качестве технологической площадки для исследований и экспериментов в области электронных информационных ресурсов. Библиотекари, работающие непосредственно со студентами и исследователями, видят их растущий интерес к оцифрованным коллекциям с точки зрения их инновационного использования в своих проектах.

К числу перспективных направлений развития в этой области относятся новые формы обработки, описания и публикации оцифрованных коллекций, их интеграция с социальными сетями, разработка инновационных средств поиска, сбора, анализа и визуализации информации в рамках “Цифровых гуманитарных наук”, в частности.

В этом плане можно упомянуть несколько проектов, поддерживаемых платформенной технологией ИнфоРост. Сотрудники ГПИБ, например, дополнительно обрабатывают оцифрованные книги  во время их загрузки на Интернет с целью выделения карт, схем и портретов. В результате, исследователям проще находить важные исторические иллюстрации в больших коллекциях оцифрованных книг.

В архивных проектах, группа историков-экспертов использует платформу для дистанционного исследования и описания коллекций при помощи стандартных форм ввода информации. Таким образом, малоизученные архивные коллекции, сканируемые поточным образом на высокоскоростном оборудовании, становятся доступны для оперативного исследования и описания в режиме онлайн прямо во время оцифровки.

Другим полезным инструментом, недавно добавленным на платформу, стал “плиточный” конвертер имиджей. Библиотекарь может по своему выбору обработать любую страницу книги или документ целиком с целью предоставить возможность исследователю рассматривать карты, схемы и иллюстрации с особо высокой степенью увеличения.

ГПИБ в настоящий момент тестирует новый инструмент для конвертациии имиджей исторических газет. В силу низкого качества газетной бумаги и ее высокой ветхости, имиджи газетных страниц иногда бывают особенно трудны для прочтения на экране. Конвертация в плиточный показ позволит читателям рассматривать документы в мельчайших деталях.

Таким образом, способность экспериментировать с новыми информационными технологиями и быстро внедрять результаты в работу является сегодня еще одним важным условием для архивов и библиотек, стремящихся развивать электронные коллекции и новые услуги для читателей.

 


Создание платформы и ее экспертиза

 

        

                    

 

   

      

 

Платформа разработана коллективом российских специалистов с многолетним опытом работы в области архивного и библиотечного дела, оцифровки фондов и создания электронных коллекций.

Первичную экспертизу платформы в 2011 году провели известные специалисты в области архивной автоматизации, российских и восточноевропейских исследований, представляющие Российский государственный архив социально-политической истории (РГАСПИ), Международный институт социальных исследований (Нидерланды), Гарвардский университет, Стэнфордский университет, университет Северной Каролины (США).

Мировой уровень разработки Платформы подтвержден отзывами специалистов по результатам ее тестирования на основе массива документов фонда «Интербригады» на кафедре исторической информатики Исторического факультета МГУ им. М.В.Ломоносова, в Историческом факультете «НИУ Высшая школа экономики», Ассоциации содействия архивному делу, Центре исследований народов России, Кавказа и Центральной Европы Дома наук о человеке (CNRS-EHESS, Франция), Итальянской ассоциации исследований современной истории (SISSCo). Все полученные отзывы положительно оценивают технологию, представленную для экспертизы.

Технология в настоящий момент активно используется в производственном режиме в Государственной публичной исторической библиотеке, Центральном архиве Министерства обороны РФ, Фонде поддержки слепоглухих “Со-единение” и в других электронных издательских проектах.

 


Использованные технологии