Кирилл Фесенко. Архивы и Искусственный интеллект. Выступление на Конгрессе молодых ученых (1-3 декабря 2022 г., Федеральная территория "Сириус"). Проект*
![]() |
Уважаемые коллеги, Большое спасибо организаторам и Константину Ильичу Могилевскому за приглашение принять участие. Готовясь к этому выступлению на конгрессе молодых ученых по захватывающей теме Искусственного Интеллекта, невольно возвращался в мыслях к годам своей собственной юности. В первой половине 80х годов прошлого века сразу после окончания школы я пошел работать лаборантом в Информационный отдел крупного научного-исследовательского института. В то время в кабинете историка наиболее продвинутым технологическим устройством была электрическая печатная машинка, а я работал в качестве человеческого Гугла - исследователи давали мне темы |
|
своих исследований, названия организаций, событий или имена, которые их интересовали, а я тратил дни и недели напролет в библиотеке бегло просматривая толстые подшивки ежедневных газет и бесчисленное количество журналов и книг в поиске необходимой им информации.
Поэтому большой радостью и неоценимой помощью в этой информационной работе стало появление компьютеров, сканеров а затем и Интернет в начале 90х годов. Был тогда потрясен, что работу, на которую приходилось тратить бесчисленное количество часов, стало возможно делать более качественно и за секунды путем сканирования и распознавания изданий и добавления к ним полнотекстового поиска. А доступ к коллекциям стал возможен мгновенно из любой точки земного шара по Интернет. До сих пор нахожусь под впечатлением от этих блестящих технических возможностей и продолжаю ими заниматься уже сколько лет так как они продолжают революционизировать доступ исследователей к информации и работу с ней. И вот, тридцать лет спустя, технический прогресс продолжается и мы обсуждаем с вами новые возможности зарождающегося Искусственного Интеллекта. Вместе с тем, данная тема не является новой, однако в последние годы ИИ привлекает особенно повышенный интерес, включая в области его применения в архивах. Работа здесь идет в разных направлениях, и соответственно специалисты дают иногда разные определения ИИ в зависимости от их конкретных направлений исследований и разработок. |
В частности, среди популярных направлений можно упомянуть:
|
|
|
При всем при этом следует оговориться, что разные программы Искусственного Интеллекта показывают результаты разного качества, которые кого то побуждают еще более активно исследовать и улучшать работу в этом направлении, а кого то укрепляют в их скептицизме.
Новые возможности здесь кажутся захватывающими - я также не смог удержаться и попробовал работу программы DALLE 2 для производства двух иллюстраций, которые мне потребовались для выступления на другой конференции в прошлом месяце. |
|
Первую слева я использовал для иллюстрации библиографов, создающих карту информационной вселенной, а вторая должна была иллюстрировать информационную вселенную российской национальной библиографии и сопровождалась призывом к слушателям уделять больше внимания исследованию "черной материи информационной вселенной" или редким или совсем неизвестным документам. Я ввел текстовый запрос на эти имиджи в программу Далли и она нарисовала их за 10 секунд каждый. Эти примеры демонстрируют впечатляющий прогресс ИИ в области иллюстрации и визуализации контента. Должен признаться, что еще недавно скептически относился к той идее, что искусственный интеллект в какой то момент может вторгнуться в такую чисто |
|
человеческую область как творчество. Последнее еще недавно казалось доступным только человеческому сознанию, а не машинному. Но вот последние опыты с программами Генерирующего Искусственного Интеллекта возможно заставят нас в будущем несколько переоценить возможности ИИ и в такой чисто человеческой области как творчество.
Но возвращаясь все же к вопросу об улучшении доступа исследователей к архивным коллекциям и цифровой трансформации архивов в следующее десятилетие, хотел бы упомянуть некоторые проблемы, разрешение которых более чем искусственного интеллекта потребует живого человеческого интеллекта, смекалки и инициативы архивных специалистов. В частности, речь идет о таких характерных проблемах в архивной отрасли как:
Что меня здесь беспокоит, в частности, так это выбор приоритетов для расходования весьма ограниченных ресурсов, которые направляются на развитие архивной системы и улучшения доступа к ней исследователей. Нам необходимо убедиться, что за занятиями популярными веяниями, в частности в области ИИ, мы не на минуту не ослабим внимания к важным текущим потребностям исследователей.
А что нужно непосредственно историкам? Их подавляющее большинство продолжает из года в год просить о достаточно простых вещах:
Слайд ниже я сделал несколько лет назад в качестве памятки о некоторых предпочтениях исследователей в области доступа к архивным коллекциям (безусловно их потребности в электронной области не ограничиваются упомянутыми на слайде):
С учетом сказанного, я бы ответил на поставленные перед панелистами вопросы о том, “Каким образом все перевести в «цифру»?” и "Идет ли в России «цифровой поворот» в истории в нужном направлении?" следующим образом:
“Большинство исследователей (даже “серьезные” ученые) проявят склонность к использованию легко доступного источника информации, даже если этот источник относительно низкого качества и далее, скорее всего, исследователи останутся удовлетворены тем, что им было легко найти по сравнению с использованием источников более высокого качества, работа с которыми требует от них больше усилий... Следуя общему правилу, люди предпочитают кажущуюся легкость доступа качеству содержания, когда они выбирают себе источник или канал информации”.
Отвечая на последний вопрос сегодняшней встречи - "Как я представляю себе будет выглядеть Архивный фонд Российской Федерации через 10 лет?", хотелось бы предположить следующее:
Заключение - Электронная библиотека исторических документов
|
В заключение хотел бы упомянуть проект “Электронная библиотека исторических документов Российского исторического общества” которая является быстрорастущей коллекцией, включающей на сегодня почти 300 тысяч текстов хорошо распознанных документов по истории России. Это потенциально прекрасный материал для экспериментов в области автоматической обработки и индексации текстов, а также применения перспективных технологий Искусственного Интеллекта в исследовательских целях. Мы приглашаем заинтересованных специалистов связываться с нами и обсуждать любые идеи в этой области. Проект Электронная библиотека исторических документов открыт для сотрудничества. |
![]() |
|
Примечания: * Панель прошла в формате вопросов и ответов. Видео-запись по адресу: https://roscongress.org/sessions/kmu-2022-glubina-istoricheskoy-pamyati-i-iskusstvennyy-intellekt/translation/ Источники: Архивы/Библиотеки и Искусственный Интеллект / Archives/Libraries and Artificial Intelligence (ноябрь 2022 - 2023 гг.) |
||