«Data-картели: компании, которые контролируют  и монополизируют нашу информацию»  Сары Ламдан

«Data-картели: компании, которые контролируют и монополизируют нашу информацию» Сары Ламдан

В прошлом выпуске мы рассказывали о перспективах и рисках, с которым столкнулось общество в эпоху Big Data. Продолжив тему больших данных, мы познакомим вас с книгой Сары Ламдан Data Cartels: The Companies That Control and Monopolize Our Information Data-картели: компании, которые контролируют и монополизируют нашу информацию») 2022 года. Некоторые критики посчитали её несколько наивной из-за предложений автора, которые она представляет в качестве варианта решения проблем, поднятых в своей работе. Тем не менее, для большинства читателей станет большим сюрпризом раскрываемое Ламдан закулисье деятельности компаний, работающих под всемирно известными брендами научных издательств, на деле давно ставших фабриками, «поглощающими и переваривающими» большие данные, львиная доля которых — результат интеллектуальной деятельности учёных. Исследователи из университетов со всего мира, включая российских коллег, даже не подозревают, что и они сами, и их монографии и статьи давно превратились по меткой метафоре автора в «корм» для «data-картелей».

Об авторе Сара Ладман_2.png

Сара Ламдан — профессор права юридического факультета Городского университета Нью-Йорка. Она является старшим научным сотрудником Коалиции научных изданий и академических ресурсов (Scholarly Publishing and Academic Resources Coalition, SPARC), научным сотрудником Энгельберг-центра инновационного права и политики юридического факультета Нью-Йоркского университета. Профессор Ламдан специализируется, среди прочего, на конфиденциальности данных и доступе к информации.

О книге

Книга «Data-картели: компании, которые контролируют и монополизируют нашу информацию» знакомит читателя с компаниями, которые, объединившись в «картель», управляют информацией и знаниями в глобальном масштабе. Под «картелем» обычно имеется в виду нерегулируемая деятельность (часто преступная) нескольких организаций, которые извлекают высокую прибыль через создание незаконной монополии и ликвидацию конкуренции. Именно этот термин Сара Ламдан выбрала для рассказа о компаниях-гигантах, которые действуют как «картели данных», наживаясь на сборе, аналитике и продаже информации. Хотя с чисто технической точки зрения, пока «их вина не доказана», в отношении их деятельности можно  было бы использовать слово «дуополия».

«Data-картели» занимаются институциональным посредничеством в сфере обмена, а точнее, торговли информацией: они продают собранные и обработанные с помощью алгоритмов данные правительству, чтобы оно могло выполнять свои обязательства перед обществом. Компании, подобные RELX и Thomson Reuters участвуют в слежке, арестах и депортации людей; они помогают государственным структурам, работодателям, арендодателям, страховым компаниям и другим лицам шпионить за нами. Мы же предоставляем им информацию о себе добровольно и безвозмездно, даже не подозревая об этом.

Автор делится инсайдерской, скрытой от общественности информацией о таких компаниях, а точнее, цифровых платформах, как Bloomberg LP, RELX (Reed, Elsevier, LexisNexis) и Thomson Reuters. Главная сила этой Книга (1).png книги — уникальное понимание автором того сегмента мира цифровых платформ, который всегда оставался в тени, что способствовало появлению и процветанию «data-картелей».

Книга структурирована по пяти видам деятельности, которую ведут компании, занимающиеся аналитикой данных. Первая и последняя главы носят, скорее, концептуальный характер: в начале нам в общих чертах представлено, как «спрут» из цифровых платформ связывает все направления работы с big data и почему их можно считать картелем; последняя глава посвящена средствам возможной правовой защиты от манипуляции большими данными.

Big Data: приватизация науки

Elsevier («E» в RELX) и Thomson Reuters продают как академический контент, так и аналитические материалы (Scopus для Elsevier, Clarivate для Thomson Reuters) о людях и организациях, создающих и использующих этот контент. Эти компании издают и анализируют большинство научных публикаций на английском языке: только Elsevier владеет 25 000 журналов и ежегодно публикует полмиллиона научных статей. RELX и Thomson Reuters известны тем, что они, фактически, эксплуатируют неоплачиваемый труд ученых, предоставляя доступ к их работам только по подписке.

Эти компании превратились из издательств в компании по аналитике больших данных благодаря оцифровке академического контента, который они бесплатно получают от исследователей. По сути, они ведут себя как тот же Amazon, выполняя роль посредников между теми, кто производит контент; теми, кто его должен потреблять; и теми, кто нанимает производителей контента. Такая бизнес-модель строится на разнице стоимости контента до и после публикации.

Кроме того, они успешно внедрили ряд показателей академического воздействия (импакт-фактор и индекс цитируемости журналов и тому подобное) как критерии, определяющие качество публикаций и уровень авторитетности авторов статей. К настоящему времени исследователи, университеты и финансирующие структуры (государственные и негосударственные) настолько увлеклись этими показателями и соответствующими платформами, что академические исследования стали самореферентной системой, эхо-камерой, работающей на алгоритмах Elsevier и Thomson Reuters. И это не идёт на пользу науке как направлению, которое должно представлять открытия и инновации, помогая человечеству решать проблемы и развиваться дальше.

Ещё одна «тёмная» сторона деятельности data-картелей — формирование цен (недопустимо высоких) на доступ к знаниям, генерируемым за счёт финансирования государственным сектором. Иными словами, учёные получают сравнительно небольшие деньги, работая в университетах и научных центрах при поддержке государства. Потом они публикуют результаты работы, не получая деньги за свой труд от «издательств» (на самом деле — аналитических цифровых платформ), приватизирующих в дальнейшем полученную информацию и знания, которые должны быть общедоступными. Это, среди прочего, подпитывает неравенство в академической среде: только богатые университеты и их библиотеки могут позволить себе доступ к публикациям. Неудивительно, что университеты с самым высоким рейтингом — это те, в которых исследователи могут иметь неограниченный доступ к базам данных RELX и Thomson Reuters. Заметим, эти университеты не находятся, например, в Африке.

Выводы: знания, которые должны быть общедоступными, превратились в большие данные для аналитики компаний-гигантов типа RELX и инструмент для извлечения прибыли теми, кто к генерации знаний не имеет прямого отношения. Сара Ламдан считает, что «академическая информационная индустрия построена на несправедливых контрактах и ​​бесплатном труде», превращающем деятельность на благо общества в товар и тем самым подрывая саму идею знания как общественного блага.

2 (2).png

Big Data: право на право

Дуополия RELX (и ее дочерней компании LexisNexis, «LX» в RELX) и Thomson Reuters (и ее дочерней компании Westlaw) также преобладает на американском рынке правовой информации. Правовая информация производится не исследователями, а законодательными, судебными и административными субъектами. Две платформы оцифровывают эту информацию и снова делают ее доступной для судей, политиков, юристов и даже граждан, если они могут позволить себе платить огромные деньги за доступ к ней. Компании также объединяют ее с оцифрованной информацией из вторичных юридических публикаций, то есть текстов, разъясняющих закон. Иногда LexisNexis и Westlaw обладают эксклюзивным правом доступа к такой информации. У правительства США есть своя система доступа к правовой информации, но она настолько плоха, что никто не может ею пользоваться. Поэтому сама государственная правовая система использует платные ресурсы от data-платформ для работы с данными. Сильная сторона этих платформ — специальное программное обеспечение для аналитики big data, позволяющее создавать материалы прогностического и даже предписывающего характера, например, о том, как те или иные кейсы будут рассматриваться в судах. Это — так называемые «юридические заключения на основе данных». Преимущества платформ, предоставляющих юридическую информацию, заключается в количестве данных, накапливаемых ими с течением времени, а также в использовании алгоритмов, позволяющих находить смысл в этом обилии информации.

Выводы: цифровые платформы превращают изначально общедоступную юридическую информацию в товар. Они приватизируют данные в пользу юристов, а точнее, юридических фирм (и их клиентов), которые могут себе позволить платить большие деньги за доступ к ним. В то время как это должны быть доступные каждому гражданину данные, предоставляемые в качестве государственной услуги.

1 (2).png

Big Data: «Большой брат» управляет финансовыми рынками

Данные финансового характера немного отличаются от данных в сфере научных исследований и правовой информации: они в меньшей мере могут считаться общедоступным благом, монополией на которое может обладать исключительно государство. Даже несмотря на то, что платформы, работающие с аналитикой больших данных в финансовой сфере могут влиять на работу финансовых рынков и, соответственно, благополучие людей (например, их пенсионные накопления и выплаты). Деятельность платформ в данном случае — это нечто среднее между брокерской деятельностью и слежкой за действиями пользователей. Компании, занимающиеся финансовой аналитикой — три основных это LexisNexis RELX, Refinitiv Eikon (бывшая Thomson Reuters Company) и Bloomberg LP — анализируют данные финансового рынка вместе с финансовой аналитикой от других компаний, прогоняя эти данные через свои алгоритмы, чтобы сгенерировать прогнозы и рекомендации для дальнейшей продажи.

Это многосторонний рынок с платформами в центре: как и в случае с академическими исследователями, сами финансовые аналитики являются одновременно и потребителями результата анализа данных, предоставляемых цифровыми платформами, и «кормом» для этих же платформ, поскольку их поведение на платформе тоже анализируется алгоритмами и превращается в информацию, подлежащую продаже.

3 (2).png

В США (как и в большинстве других стран) SEC (Комиссия по ценным бумагам и биржам) санкционирует и производит большое количество информации, которая из-за огромных цифр и обилия юридических терминов становится недоступной для понимания даже тем, кто эту информацию генерирует. Поэтому все заинтересованные стороны всё больше полагаются на данные, собранные с помощью алгоритмов.

Выводы: как и в случае с информацией правового характера, существует опасность того, что финансовый анализ станет эхо-камерой финансовых рынков и мировой экономики. По мнению Ламдан, финансовые информационные продукты неэффективны, потому что они напрямую диктуют финансовому сектору, как действовать в той или иной ситуации. Они не предсказывают возможные варианты развития событий, но являются «самоисполняющимися финансовыми пророчествами». А это уже можно считать тревожным знаком, ведь глобальная экономика в настоящее время держится на стадном инстинкте финансистов, пользующихся автоматизированными торговыми площадками. При этом только самые состоятельные трейдеры (и их клиенты) могут позволить себе необходимую информацию. Трейдер-непрофессионал остается наедине со своей интуицией, поскольку не может заплатить за неё. При этом никто не регулирует деятельность платформ: есть правила для предотвращения инсайдерской торговли, но не существует никаких правил, запрещающих компаниям, предоставляющим финансовую информацию, раскрывать её за деньги до того, как она станет общедоступной. Это означает, что компании, работающие с данными, могут делать с информацией то, что не имеют права делать сами компании, торгующие на финансовом рынке.

5 (3).png

Использованные ресурсы:

Sarah Lamdan Data Cartels: The Companies That Control and Monopolize Our Information ‘2022

Recap: Data Cartels Book Talk ’2022 

Edward Junhao Lim Book Review: Data Cartels: The Companies That Control and Monopolize Our Information ’2023

Digital Governance Book Review: Data Cartels ’2023