Пол Артур: в сфере гуманитарных знаний данные могут быть настолько обширными, что изначально определены как big data

19964697_1450864051618210_1324970447_nЧитайте интервью с профессором Артуром Полом Уильямом Лонгли (Arthur Paul William Longley), Университет Эдит Коуэн, Австралия, сделанное во время его визита в Пермский университет на конференцию «Цифровая гуманитаристика: ресурсы, методы, исследования».

Андрей Хохряков: Г-н профессор, принимая участие в Естественнонаучном Форуме Пермского университета, в его значимой части, посвящённой вопросам цифровой гуманитаристики (“digital humanities”, DH; здесь и далее - ЦГ), позвольте напомнить сделанное Вами определение этого предмета. Далее предлагаю поговорить о том, как ЦГ проявляет себя в реальности.

Когда-то вы определили ЦГ как «теоретическое обоснование и практическое применение компьютерных технологий для лучшего понимания сложных культурных и социальных явлений, включая использование и разработку инструментов для анализа данных, форматов и подходов для поддержки новых методов исследования, а также обеспечение сохранения цифровых записей и культурного наследия».

Не могли бы вы прокомментировать это определение? Какие толкования ЦГ существуют? Все ли мы одинаково его понимаем?

Пол Артур: В различных частях мира ЦГ понимают по-разному, отсюда и вопросы вокруг определений. В каждой стране – свой контекст. Насколько я могу заметить, здесь, в России, ЦГ развивались преимущественно в русле исторических исследований. Это отличает вас от других стран, к примеру Австралии, где развитие ЦГ тесно связано с исследованиями в сфере культуры, включая активность в библиотечной, архивной и музейной сфере, а также в общественной жизни.

Говоря о ЦГ, возникает вопрос о выборе оптимальных носителей для сохранения информации. В прошлом это были дискеты и независимые серверы, затем компакт-диски и USB-устройства, теперь это облака. Насколько надежными будут устройства хранения данных, которые мы используем сегодня, через 10 лет?

Это действительно важный вопрос, хотя он связан с гораздо более сложной задачей: вся наша жизнедеятельность становится частью цифрового мира. Под влиянием новых цифровых подходов меняются и научные исследования, в процессе которых появляется огромное количество данных, которые требуют сохранения и защиты. Помимо этого, мы всё чаще проживаем нашу жизнь в формате «онлайн»,  что способствует росту огромного количества данных. Я думаю, вне зависимости от характера этого участия, мы должны доверять тем решениям, которые будут вырабатываются в достижении безопасного управления и защиты наших данных. Это огромная проблема, потому что объем данных, собранных, к примеру, при наблюдении за Вселенной, настолько велик, что не может быть эффективно обработан или проанализирован прежде чем он будет переведён на последующее, более объёмное цифровое запоминающее устройство. Это проблема не только для астрономов, но и для нас, исследователей в сфере гуманитарных знаний, где данные могут быть настолько обширными, что изначально определены как big data. ЦГ как раз предлагает новые способы восприятия обширных объёмов данных. Их нельзя прочитать, как если бы это была книга, их можно анализировать только посредством компьютера. Это одно из определений ЦГ: научно-исследовательская работа, которая немыслима без цифровых электронных методов.

Означает ли это, что книги обесценятся?

Ещё какое-то время назад нам предсказывали, что книги «умрут», что они уйдут из нашей жизни. Однако в реальности этого не произошло. Даже при том, что многие первоисточники получают оцифровку, вы все равно читаете их в виде «виртуальной книги» - типа Kindle или других носителей. При этом формат чтения, по сути, остаётся прежним. И я полагаю, это действительно показательный момент, потому что хотя Интернет и предоставляет разнообразные возможности для новых видов текстов и новых видов структурирования информации, на самом деле книга не сброшена со счетов.

Поэтому я не считаю, что книги умрут. Гораздо более вероятно, что в будущем история мира будет оцифрована и представлена на наших текстовых носителях. Всё же, ввиду огромного количества печатных материалов, потребуются десятилетия, чтобы достичь этой цели. Но преимущество очевидно: это доступ к самым значительным печатным произведениям в цифровой форме из любой точки мира и в любое время для каждого. Это своего рода перспективы открытых знаний для гуманитарных наук.

Источники информации больше не являются просто напечатанным первичным доказательством своего существования. Они постоянно дополняются цифровой информацией, которая была подготовлена и собрана историками и литературоведами; эта информация варьируется от блогов до социальных сетей,  онлайн-журналов и оцифрованных библиотечных коллекций. Имеющийся у нас запас информации гораздо больше, чем когда-либо в прошлом, и что он открывает новые возможности для исследований. Однако в то же время это означает, что мы должны формулировать достоверные исходные точки, лежащие в основе исследований, и быть осторожными в в силу доступности данных. Здесь важно умение сортировать и находить информацию, обладающую значимостью и быть уверенным в её достоверности.

ЦГ – это, по сути, сотрудничество между гуманитарными и точными науками. Это новая связка гуманитарных и общественных наук с информатикой и практическим опытом в сфере IT в попытке решения наиболее сложных комплексных задач.

paul-2

Можем ли мы назвать ЦГ своего рода подходом, отношением?

Думаю, да. Что в этом импонирует лично мне, так это то, что проекты ЦГ часто сочетают в себе множество сторон и являются междисциплинарными.

Ваше мнение о Википедии: противостоит ли ЦГ такому типу «знаний»? Следует тем же путём? Или это нечто абсолютно иное?

Это важный вопрос, поскольку Википедия не заслуживает доверия как надежный авторитетный источник, и никогда таковым не была. На ранней стадии Википедия вообще не использовалась в университетской среде, обращения к этому ресурсу не поощряли, она была приравнена к любой ложной непроверенной информации. Любопытно, что сегодня определения новых терминов, входящих в обиход, зачастую можно обнаружить именно в Википедии. Так, в Википедии вы найдёте возможно лучшее определение ЦГ – постоянно меняющееся и обновляемое – как отражение того, каким люди видят этот мир.

Википедия – это явление конкретного направления ЦГ, связанного с «краудсорсингом», привлечением внимания и ресурсов большого количества людей, вовлечением общества в производство научных знаний, публичным вкладом в приумножение возможностей цифровых ресурсов. Википедия – довольно интересная модель в формировании будущих изданий, потому что она похожа на постоянно меняющуюся книгу, у которой нет ни одной окончательной версии.

Позитивный пример краудсорсинга - проект под названием «Троув» (Trove) в Национальной библиотеке Австралии. В рамках этого проекта почти миллион человек в день способен внести поправки в оцифрованную газетную коллекцию, т.к. при сканировании старых газет оптическое распознавание символов (OCR) может допускать неточности.  Это яркий пример того, как общественность – зарегистрированные пользователи библиотеки – способны исправить и дополнить оцифрованный ресурс периодических изданий. Цель создания этой коллекции - оцифровать каждую газету, когда-либо выпущенную в Австралии. Это смелая задача, признанная и финансируемая австралийским правительством в качестве основного национального ресурса; здесь, как и в Википедии, пользователи вовлечены в процесс исправлений и обновлений, отчего сам ресурс становится точнее и лучше.

Я думаю, что это показывает ценность и сопричастность общества своей истории. К сожалению, несмотря на большое количество научных проектов, очень мало людей имеют о них представление. Цифровые технологии делают гуманитарные исследования осязаемыми, доступными и ценными из-за участия в них общественности.

В ваших документах и выступлениях вы упомянули о том, что проект ЦГ финансируется правительством Австралии. Насколько велик риск использования государством ЦГ в своих интересах?

На самом деле у нас существует почти противоположная проблема: источником подобного беспокойства выступают, скорее, корпорации и коммерческие интересы.

Правительство предоставляет финансирование Австралийскому Совету по научным исследованиям. Он состоит из довольно большого количества экспертов и обеспечивает регламентированный процесс подачи заявок на финансирование посредством тщательного отбора. Совет определяет характер освоения финансирования и выделяет его отдельным исследователям и университетам. Таким образом, государство не принимает непосредственного участия в определении того, какие исследования будут поддерживаться, а также какие виды ресурсов будут задействованы.

Все проекты, которые финансируются через Совет по научным исследованиям Австралии, должны предоставить открытые и общедоступные результаты своей работы; они также должны быть зафиксированы в виде лицензий Creative Commons или какой-либо иной открытой лицензии, чтобы их можно было цитировать и использовать повторно, а также не носить коммерческий характер, за исключением случаев, когда научное изобретение изначально предполагает получение патента или коммерческое использование.

paul-1

В рамках австралийской системы образования университеты финансируются государством?

Да, практически все, за исключением одного (частный Университет Нотр-Дам, the Notre Dame University, но он также получает публичные выплаты). Университеты крайне мало поддерживаются частными инвестициями, в основном они финансируются государством, однако не контролируются им. Предполагается, что у нас независимая система образования. Каждый университет решает собственные вопросы и принимает собственные решения. Государство предоставляет вузам определенный объём финансирования на основании того, насколько успешны их исследования. Это эффективный подход, основанный на соревновательности в научно-исследовательской работе. Перспективные исследования получают бóльшую поддержку правительства.

Таким образом, государство действительно не контролирует университеты напрямую; Они обеспечивают финансирование, позволяющее вузам работать. И вместе с тем поощряет привлечённые . С другой стороны, в Австралии у нас нет такой традиции, как в Америке, где существует много негосударственных фондов и частных пожертвований.

В своих отчётах Вы упоминаете, что «за последнее десятилетие правительством было инвестировано в научные исследования более полумиллиарда долларов...»

Да, но не на ЦГ, а на электронные исследования в целом, включая другие дисциплины...

Вы не считаете, что финансируя исследование, государство способно оказать влияние на его результат? В особенности, если криминальная активность становится частью государственной политики. Скажем, государство - это остров с коренным населением, против которого ранее в прошлом государство совершало бесчеловечные действия. Или, если в этом процессе каким-то образом задействованы иммигранты? Или был попран закон? Будет непростым вопросом, сделает ли государство результат этого расследования прозрачным…

Это и вправду вопрос о том, насколько правительства способны поддерживать научные исследования - открытым и свободным способом, без цензуры или контроля над потенциальным результатом, даже если он не так хорош для государства. Я думаю, что при участии Совета по научным исследованиям, процесс финансирования науки в Австралии достаточно эффективен. Наша политическая система полностью оделена от работы университетов. И у нас никогда не возникало каких-либо сомнений в том, что исследовательский проект будет закрыт или его результаты будут считаться недействительными. К лучшему или к худшему, но наше правительство обновляется настолько часто, что это не составляет проблему.

Тот факт, что государство поддерживает то или иное исследование, делает его нейтральным, объективным. Напротив, если он опубликован частной компанией, всегда возникает вопрос, зачем они это делают, и инвестировали ли они в это исследование. Характерным примером тому выступают в Австралии горнодобывающие компании ... Все исследования, которые они финансируют, обычно не обнаруживают каких-либо негативных последствий их активности и говорят в пользу добычи ресурсов без какого-либо ущерба для территории.

Ещё один пример – Google и крупные корпорации, которые, казалось бы, предоставляют определённые свободы, оцифровывая мировую литературу. Однако, по сути, они владеют этими цифровыми изображениями; я считаю, что это тот вид деятельности, который должен финансироваться правительством, а не только частными организациями. Мы должны вкладывать больше денег в оцифровку через университеты, а не просто отдавать это на откуп рынку или частным корпорациям. С другой стороны, конечно, без инвестиций у нас не было бы всех этих замечательных результатов. Загвоздка, скорее, в долгосрочном хранении данных, поскольку никто не уверен, что ждёт компанию наподобие Google в будущем, как долго и где она будет хранить свою информацию. Поэтому, если сохранение нашего культурного наследия – в значительных объёмах – предполагается  на века и тысячелетия, у историков возникает вопрос к правомерности обеспечения этого процесса теми, кто ставит своей целью материальную выгоду – корпоративной структурой, коей является Google. На сегодняшний момент большинство процессов оцифровки выполняются коммерческими компаниями. В отличие от традиционных способов, в которых задействованы публичные библиотеки, музеи, архивы; именно они сохранили записи о нашей культуре и истории на будущее, стараясь сделать их максимально открытыми и свободными.

В своих статьях Вы также упоминаете о лоббировании в процессе внедрения ЦГ...

Ещё каких-то шесть-семь лет назад термин ЦГ вообще не был представлен в документах, на правительственном уровне. И это несмотря на то, что в цифровой сфере и связанных с нею проектах к тому моменту была проделана масса работы. Суть лоббирования заключалось в создании ассоциации, которая оперировала бы термином ЦГ и сказала Совету по научным исследованиям: «Это важное поле, мы хотим сконцентрировать в нём наши усилия, к тому же имеющее международное значение».

Говоря «мы», вы имеете в виду ...?

Коллектив исследователей, изначальный состав ассоциации - представители всех штатов Австралии, а также Новой Зеландии. Результатом процесса лоббирования стал тот факт, что сейчас в крупных правительственных отчетах термин ЦГ отчётливо присутствует и используется. Этот термин находит применение на государственном уровне для описания нового вида активности, который использует компьютерные и цифровые медиа в своих исследованиях.

Кроме того, нельзя не отметить растущее употребление этого термина на глобальном уровне, независимо от вариации в восприятии ЦГ в разных частях мира.

Насколько ощутимо меняется глобальное понимание ЦГ, когда в ней оказываются затронуты национальные интересы?

В большинстве стран мира, к сожалению, на исследовательский процесс влияют политические решения, и их цель - подтвердить определенные результаты. Удачным примером является изменение климата. В этом вопросе Австралия испытывает определённые проблемы: климат становится всё более экстремальным, немало природных стихийных бедствий – наводнения и пожары. Поэтому, хотя работа по изучению изменений климата и заключает массу противоречий, она должна носить нейтральный и сбалансированный характер.

Значит, это своего рода вызов для правительства, потому что на это проблема, требующая ответа?

И здесь как раз актуальна ЦГ, позволяющая исследовать сложные социальные и культурные проблемы по-новому, привлекая к этому всё многообразие данных. Иногда это может противоречить привычному пониманию какой-либо проблемы. Или, напротив, укрепить в изначальном суждении. Тем не менее, привлечение многоуровневых данных и использование цифровых методов - это ещё один веский вклад в развитие более системного, глубокого знания.

В своей статье вы упоминаете спонсорство в виде электронных стипендий (e-scholarships). Могли бы вы объяснить, что это?

Совокупность цифровой активности библиотек часто именуется электронными стипендиями. Библиотеки предоставляют свои услуги в развитии новых форматов исследований. Лучшим примером такой активности выступает Центр электронных стипендий в Мельбурнском университете (University of Melbourne), одном из лучших университетов Австралии. Центр обеспечивает все виды цифровых услуг, поддерживает проекты, предоставляет программное обеспечение.

19893853_1450864058284876_769268354_o

Как получить электронную стипендию?

Как правило, такая стипендия выдаётся под проектную деятельность. Поэтому, если у вас есть проект, вы можете подать заявку на финансирование и обратиться в Центр электронных стипендий, который будет с вами взаимодействовать в рамках проекта. Работа центра – в сочетании опыта библиотекарей, занимающихся цифровыми коллекциями, и ресурсов – баз данных, программных решений.

Насколько коренное население Австралии вовлечено в процесс ЦГ?

Отличный вопрос и повод для активности. Культура аборигенов в Австралии не имеет письменного языка. Это означает, что запечатлеть звуки и образы, рождённые в культуре аборигенов, жизненно важно для сохранения их культуры и языка. Представьте, насколько востребованы в этой связи с цифровые технологии; к примеру, нами сформированы довольно внушительные архивы звукозаписей языков, находящихся под угрозой исчезновения. Языки австралийских аборигенов насчитывают несколько сотен, но лишь немногие из них сохранились до наших дней. Единственное свидетельство этих языков – звуковые записи, которые в своё время были собраны и оцифрованы. Некоторые из них были сделаны довольно давно, и теперь эта коллекция – своего рода национальный архив исчезающего языка.

Приведу другой пример... Существует немало священных предметов, изображений и артефактов, которые хранят коренные общины, живущие посреди пустыни. И есть программа оцифровки 3D-изображений этих объектов, имеющих большое значение для истории аборигенов, с тем, чтобы не помещать их в музей, а создать их цифровой образ и сохранить его в библиотеке. Не забирать у людей эти артефакты, а сохранить в цифровом виде. Не обладай мы технологией процесса 3D-фотографии и моделирования, мы бы не могли воспроизвести эти объекты с учётом всех мельчайших деталей. Я считаю, это удачный пример сохранения культурного наследия с использованием цифровых технологий.

Не кажется ли Вам, что здесь мы подходим к иной проблеме – обесценивания оригиналов в пользу их глобального тиражирования? К примеру, Мона Лиза как «принт» для футболок. Это также и этический вопрос – насколько мы вправе распоряжаться уникальным наследием подобным образом?

Это довольно интересная тема. В своё время я участвовал в проекте под названием «ДоумЛаб» (DomeLab), Сидней, Австралия. Проект создаёт среду для визуализации - купольную проекцию с использованием дорогостоящего оборудования, воссоздающую интерьер объектов, которые настолько хрупки, или находятся под угрозой обрушения, что никто больше не сможет там побывать. Поэтому, используя фотосъёмку с высоким разрешением, исследовательская группа путешествует по миру и запечатлевает такие места. Нередко это религиозные объекты, такие как пещеры, труднодоступные и отдаленные уголки... Я понимаю, когда вы говорите¸ что в тиражировании изображений, ввиду их доступности, оригиналы могут терять свою ценность, значение и особый контекст...

… Магию, «силу»?

Но в этом случае их никто не увидит. Я считаю, что реальная ценность оцифровки очевидна в тех случаях, когда эти объекты слишком хрупкие, слишком деликатные, чтобы люди смогли когда-либо увидеть оригинал. Мне кажется, сложно это переоценить, когда речь идёт о сохранении хрупкого культурного наследия.

К вопросу ценности оригинала как произведения искусства – в его противопоставлении цифровой копии… тем более, когда есть возможность увидеть Мону Лизу вживую… А что, если фото этой картины в высоком разрешении окажется не хуже? Впрочем, нет, наверняка вы захотите увидеть оригинал…

И тем не менее, меня поразила одна сцена в Эрмитаже, в Санкт-Петербурге… В одном из залов в большом стеклянном футляре выставлены довольно сложные часы – золотой «Павлин» (прим.авт: показывают в заставке ТК «Россия-Культура»). А рядом с ним, в музее - цифровой экран высокого разрешения, где в увеличении, на видео показано, как работают часы. Так вот, в день посещения мною музея, я оказался с этим потрясающим и подлинным произведением искусства один на один. Зато рядом, в шаге от меня оказалось около сотни человек, приникнувших глазами к экрану, наблюдая за записью. В руках у них были «айфоны» и планшеты: они снимали с видео на видео! Хотя оригинал был здесь же, рядом. Вот такая картина открылась моим глазам.

Мне кажется, что люди сегодня хотят видеть изображения с высоким разрешением. Мы вступили в новую эру, когда само собой разумеющимся представляется возможность хранения объектов в цифровом виде, а также умение разглядеть их в мельчайших деталях, не доступных ранее человеческому глазу. Это идея «зумминга» (zooming), масштабирования, увеличения. Иная разновидность восприятия объектов и текста. Хорошо заметным это становится на примере оцифрованных рукописей: многократное увеличение фото позволяет разглядеть мельчайшие составляющие – вплоть до частиц пыли на странице! Раньше мы и помыслить не могли о том, что чтение будет заключать в себе такие возможности. Повторю: это становится возможным исключительно благодаря цифровым технологиям и переводу в цифровой формат.

Интервью, перевод: Андрей Хохряков, управление общественных связей, Пермский университет. Вопросы к интервью сформулированы на основании статьи П.У.Артура «Социальные связи и инфраструктурная сеть гуманитарных наук» («Social Linking and the Humanities Networked Infrastructure» https://www.hrionline.ac.uk/openbook/chapter/dhc2014-arthur).

Фото: Андрей Шеварднадзе, Анастасия Фадеева.

16 мая 2017 года