Этика больших данных

Материал из wikixw
Перейти к навигации Перейти к поиску

Этика больших данных, также известная как просто этика данных, относится к систематизации, защите и рекомендациям концепций правильного и неправильного поведения в отношении данных, в частности персональных данных.[1] С момента появления Интернета количество и качество данных резко возросло и продолжает расти в геометрической прогрессии. Большие данные описывают этот большой объем данных, который настолько объемный и сложный, что традиционное прикладное программное обеспечение для обработки данных не справляется с ними. Недавние инновации в медицинских исследованиях и здравоохранении, такие как высокопроизводительное секвенирование генома, получение изображений с высоким разрешением, электронные медицинские записи пациентов и множество подключенных к Интернету медицинских устройств, вызвали поток данных, который в ближайшем будущем достигнет диапазона эксабайт. Этика данных приобретает все большую актуальность по мере увеличения количества данных из-за масштаба воздействия.

Этика больших данных отличается от информационной этики, поскольку в центре внимания информационной этики находятся вопросы интеллектуальной собственности и проблемы, связанные с библиотекарями, архивистами и специалистами в области информации, в то время как этика больших данных больше касается сборщиков и распространителей структурированных или неструктурированных данных, таких как брокеры данных, правительства и крупные корпорации.

Принципы[править]

Этика обработки данных связана со следующими принципами: [оригинальное исследование?]

Право собственности - частные лица владеют своими собственными данными. Прозрачность транзакций - Если используются персональные данные физических лиц, они должны иметь прозрачный доступ к разработке алгоритма, используемого для создания совокупных наборов данных Согласие - Если физическое или юридическое лицо хотело бы использовать персональные данные, необходимо информированное и явно выраженное согласие владельца данных на то, какие персональные данные передаются кому, когда и с какой целью. Конфиденциальность - Если происходят транзакции с данными, необходимо приложить все разумные усилия для сохранения конфиденциальности. Валюта - Физические лица должны быть осведомлены о финансовых операциях, возникающих в результате использования их персональных данных, и о масштабах этих операций. Открытость - Совокупные наборы данных должны быть в свободном доступе

Право собственности[править]

Кто владеет данными? Владение включает в себя определение прав и обязанностей в отношении собственности. Концепция владения данными связана со способностью человека контролировать и ограничивать совместное использование своих собственных данных. Если один человек записывает свои наблюдения на другого человека, которому принадлежат эти наблюдения? Наблюдатель или наблюдаемое? Какие обязанности имеют наблюдатель и наблюдаемый по отношению друг к другу? В связи с массовым распространением и систематизацией наблюдений за людьми и их мыслями в результате использования Интернета, эти вопросы приобретают все большее значение для решения. Рабство, собственность на человека, объявлено вне закона во всех признанных странах. Вопрос владения личными данными находится на неизвестной территории между корпоративной собственностью, интеллектуальной собственностью и рабством. Кому принадлежит цифровая идентификация?

Европейские законы, Общие правила защиты данных, указывают, что отдельные лица владеют своими личными данными. [2]

Персональные данные относятся к наборам данных, описывающих человека, начиная от физических характеристик и заканчивая его предпочтениями и поведением. Примеры персональных данных включают: данные генома, местоположение GPS, письменное общение, устное общение, списки контактов, привычки просмотра Интернета, финансовые операции, расходы в супермаркетах, налоговые платежи, судимости, записи с камер ноутбуков и мобильных телефонов, записи с микрофонов устройств, привычки вождения с помощью автомобильных трекеров, мобильные и медицинские записи, фитнес-активность, питание, употребление психоактивных веществ, сердцебиение, режим сна и другие жизненно важные показатели. Совокупность личных данных одного человека формирует цифровую личность (или, возможно, цифровое альтер-эго более подходит). Цифровая идентификация охватывает все наши личные данные, которые скрывают, представляют и связаны с нашим физическим и идеологическим "я". Различие между категориями данных не всегда четко. Например, данные о здоровье и банковские данные взаимосвязаны, потому что поведение и образ жизни могут быть выведены с помощью банковских данных и чрезвычайно ценны для прогнозирования риска хронических заболеваний. Таким образом, банковские данные - это также данные о здоровье. Данные о состоянии здоровья могут указывать, сколько человек тратит на здравоохранение, поэтому данные о состоянии здоровья также являются банковскими данными. Эти совпадения существуют и между другими категориями данных, например, данные о местоположении, данные о просмотре в Интернете, налоговые данные, по сути, касаются физических лиц.

Защита личных неимущественных прав человека основана на представлении о том, что личные данные являются прямым выражением личности человека: следовательно, личные неимущественные права принадлежат человеку и не могут быть переданы другому лицу, кроме как по завещанию после смерти человека. Моральные права включают в себя право быть идентифицированным как источник данных и право возражать против любого искажения или искажения данных, которые могут нанести ущерб его или ее чести или репутации. Эти моральные права на персональные данные являются бессрочными.

Ключевым компонентом владения персональными данными является уникальный и контролируемый доступ, то есть эксклюзивность. Владение подразумевает эксклюзивность, особенно в отношении абстрактных понятий, таких как идеи или точки данных. Недостаточно просто иметь копию собственных данных. Другие должны быть ограничены в своем доступе к тому, что им не принадлежит. Знать, какие данные хранятся у других, - задача практически невыполнимая. Более простым подходом было бы замаскироваться под бессмысленную информацию. Чтобы гарантировать, что у корпораций или учреждений нет копии, можно посылать шум, чтобы запутать данные, которые у них есть. Например, робот может случайным образом искать термины, которые обычно используются, делая данные, полученные поисковой системой, бесполезными из-за путаницы (см.: Track Me Not by New York University).

Владение делает акцент на возможности удобного перемещения данных из одного сервиса в другой, т.е. переносимости. Когда персональные данные принадлежат конкретному лицу, у него есть возможность просто удалить их и перенести на другой сайт, если он будет недоволен сервисом. Людям должна быть предложена высокая степень удобной переносимости, позволяющая переключаться на альтернативные варианты без потери исторических коллекций данных, описывающих предпочтения продукта и личные беседы. Например, можно переключиться на альтернативное приложение для обмена сообщениями, и это должно быть возможно без потери записей предыдущих разговоров и контактов. Предоставление частным лицам возможности переключать сервисы без неудобств, связанных с потерей исторических данных, означает, что сервисы должны радовать клиентов, предоставляя качественные услуги, а не ограничивать их из-за несовместимости с альтернативами.

Для обеспечения переносимости выражение данных должно быть стандартизировано таким образом, чтобы это могло происходить без проблем. Например, описание единицы измерения как "килограммы", а не "кг" означает, что роботы распознают их как разные, хотя они одни и те же. Эти небольшие отклонения могут привести к появлению беспорядочных данных, которые невозможно будет легко объединить или перенести в новую систему, которая не сможет их распознать. В настоящее время Apple заявляет, что предоставляет услуги конфиденциальности, однако извлечение данных из систем Apple затруднено, что затрудняет переход на альтернативу. В рамках системы торговли персональными данными выражение данных будет стандартизировано для удобства переносимости одним нажатием кнопки. Стандартизация также облегчила бы создание механизмов очистки данных, необходимых для установления сдержек и противовесов, подтверждающих качество данных. Объединив несколько источников, можно было бы идентифицировать ошибочные или ошибочно введенные данные.

Кто владеет данными сегодня? Сегодня данные контролируются и, следовательно, принадлежат владельцу датчиков. Пользователь, делающий запись, или организация, владеющая датчиком, по умолчанию контролирует, что происходит с этими данными. Например, банки контролируют банковские данные, исследователи контролируют данные исследований, а больницы контролируют данные медицинских карт. В силу исторических причин текущий сценарий таков, что исследовательские институты хранят данные о фрагменте данных, описывающих часть человека. Данные исследований в области здравоохранения в Европе существуют фрагментарно и контролируются различными учреждениями. Категории данных часто больше описывают, кто контролирует эти данные и где они хранятся, а не то, что описывают данные или приложение, к которому они могут быть применены. Хотя Интернет никому не принадлежит, корпорации стали контролировать большую часть персональных данных, создавая ценность за счет использования сбора данных, поисковых систем и средств коммуникации.[3] По умолчанию, в качестве побочного эффекта владения интеллектуальной собственностью, составляющей интернет-инструменты, эти корпорации собирают наши цифровые идентификаторы в качестве сырья для услуг, предоставляемых другим компаниям с прибылью. Большая часть данных, собираемых с помощью интернет-сервисов, - это персональные данные, описывающие отдельных лиц. Традиционно медицина собирает данные вокруг человека, потому что это позволяет лучше понять состояние здоровья. При изучении эпидемиологии данные групп по-прежнему организованы вокруг отдельного человека. Многие из процессов, которые становятся более эффективными, касаются индивидуальной и групповой динамики. Однако данные не обязательно организованы вокруг отдельного человека, скорее, данные контролируются владельцем датчиков.

В Китае правительство в значительной степени владеет данными. В одной китайской провинции данные использовались для расчета социального индекса на человека на основе индивидуального поведения онлайн и офлайн, такого как переход улицы и количество туалетной бумаги, используемой в общественном туалете. Социальный индекс определяет доступ к определенным государственным услугам.

Прозрачность транзакций[править]

Высказывались опасения по поводу того, как предубеждения могут быть интегрированы в разработку алгоритмов, что приводит к систематическому подавлению.[4] Дизайн алгоритма должен быть прозрачно раскрыт. Следует прилагать все разумные усилия, чтобы учитывать различия между отдельными лицами и группами, не упуская из виду равенство. Разработка алгоритмов должна быть всеобъемлющей.

С точки зрения управления, этика больших данных касается того, какие типы выводов и прогнозов следует делать с использованием технологий больших данных, таких как алгоритмы.

Упреждающее управление - это практика использования прогнозной аналитики для оценки возможного будущего поведения. Это имеет этические последствия, поскольку дает возможность ориентироваться на определенные группы и места, которые могут способствовать предрассудкам и дискриминации Например, прогнозирующая полиция выделяет определенные группы или районы, за которыми следует следить более внимательно, чем за другимичто приводит к усилению санкций в этих областях и более тщательному наблюдению за теми, кто соответствует тем же профилям, что и те, на кого наложены санкции.

Термин "ползучесть контроля" относится к данным, которые были сгенерированы с определенной целью, но которые используются повторно. Такая практика наблюдается в отношении данных авиационной отрасли, которые были использованы повторно для профилирования и управления рисками безопасности в аэропортах.

Что касается персональных данных, человек имеет право знать:

  • Зачем собираются данные?
  • Как это будет использоваться?
  • Как долго они будут храниться?
  • Как она может быть изменена заинтересованным лицом?
  • Примеры этичного использования транзакций с данными включают:

Уставные цели: Весь сбор и использование персональных данных государством должны быть полностью прозрачными и покрываться официальной лицензией, согласованной до любого сбора данных. Этот гражданско-правовой договор между физическим лицом и ответственными органами устанавливает условия, на которых физическое лицо предоставляет ответственным органам лицензию на использование своих данных в соответствии с вышеуказанными принципами прозрачности Социальные цели: Любое использование личных данных в социальных целях должно быть добровольным, а не отказом. Они должны соответствовать принципам прозрачности.

Преступность: Для предупреждения преступности должен быть установлен и широко обнародован четкий набор общих принципов сбора и использования персональных данных. Руководящий орган государства должен рассмотреть и утвердить эти принципы. Коммерция: Персональные данные, используемые в коммерческих целях, принадлежат отдельному лицу и не могут быть использованы без лицензии от частного лица, устанавливающей все разрешенные виды использования. Сюда входят данные, собранные со всех веб-сайтов, посещений страниц, переходов с сайта на сайт и других действий в Интернете. Частные лица имеют право решать, как, где и используются ли их персональные данные в коммерческих целях, в каждом конкретном случае или на категориальной основе. Исследования: персональные данные, используемые в исследовательских целях, принадлежат отдельному лицу и должны быть лицензированы пользователем в соответствии с условиями формы личного согласия, которая соответствует всем принципам прозрачности, изложенным выше. Внеправовые цели: Персональные данные могут быть использованы во внеправовых целях только с явного предварительного согласия правообладателя.

Согласие[править]

Если физическое или юридическое лицо хотело бы использовать персональные данные, ему необходимо осознанное и явно выраженное согласие на то, какие персональные данные передаются кому, когда и с какой целью от субъекта данных. Субъект информации имеет право знать, как использовались его данные.

Транзакция данных не может использоваться в качестве козыря в несвязанном или излишнем вопросе согласия, например, для улучшения маркетинговых рекомендаций при попытке связаться с родственником. Несмотря на то, что существуют службы, в которых необходим обмен данными, эти транзакции не должны преувеличиваться и должны проводиться в контексте. Например, человеку необходимо поделиться данными, чтобы получить адекватные медицинские рекомендации, однако эти медицинские данные не должны автоматически передаваться поставщику медицинской страховки. В конечном счете, принятие решения о своих данных зависит от человека. Это отдельные транзакции с данными, которые следует рассматривать как таковые. Подразумеваемое согласие на передачу права собственности на данные из-за использования приложения для чата не считается действительным.

Полный объем и масштабы транзакции должны быть подробно описаны для отдельного лица, которому должна быть предоставлена разумная возможность участвовать в процессе оценки того, хотят ли они участвовать. Время имеет решающее значение. т.е. Эти проблемы следует решать в спокойный момент, имея время на размышление, а не в тот момент, когда совершается срочная покупка или возникает неотложная медицинская помощь.

Разрешение должно быть дано в явном, а не подразумеваемом формате. То, что приложение выбрано для общения, не означает, что необходим доступ к списку контактов. Кнопка, на которую нажимают, чтобы дать разрешение, не должна быть спроектирована таким образом, чтобы автоматическое поведение было выбрано. Например, в бинарных опционах, если одна кнопка меньше другой, или если одна кнопка скрыта в дизайне, а другая выскакивает, или если для одной кнопки требуется несколько нажатий, тогда как для другой - один щелчок.

Хотя человек может дать согласие на продолжение общей темы, всегда должна быть возможность отозвать это разрешение для будущих транзакций. Аналогично согласию на сексуальную активность, отзыв прошлого согласия на транзакции с данными невозможен. Например, физическое лицо может дать согласие на использование своих персональных данных для любых целей, способствующих лечению сердечно-сосудистых заболеваний, до дальнейшего уведомления. Пока человек не передумает, эти транзакции могут продолжать происходить беспрепятственно без участия человека.

Динамическое согласие в контексте медицинских и геномных исследований может обеспечить более подходящий подход к согласию, чем одноразовое или широкое информированное согласие, с точки зрения проблем, изложенных выше.

Конфиденциальность[править]

Если происходят транзакции с данными, необходимо приложить все разумные усилия для сохранения конфиденциальности.

"Никто не должен подвергаться произвольному вмешательству в его частную жизнь, семью, жилище или переписку, а также посягательствам на его честь и репутацию. Каждый человек имеет право на защиту закона от такого вмешательства или нападений". - Декларация прав человека Организации Объединенных Наций Статья 12.

Почему конфиденциальность имеет значение? Данные полезны для повышения эффективности систем; однако определение конечной цели этой эффективности имеет важное значение для оценки того, насколько этично использование данных.

Использование правительством мониторинга данных для наблюдения за гражданами требует четкого разрешения в рамках соответствующего судебного процесса. Возможно, было бы даже более эффективно наблюдать за относительно небольшим числом преступников вручную, а не отслеживать относительно большое население. Тотальное наблюдение за жителями со стороны национальных правительств и корпораций - скользкий путь к оруэлловскому стилю управления. Конфиденциальность - это не сохранение секретов, это выбор, права человека, свобода и свобода. Например, обмен медицинскими данными с врачом при том понимании, что они будут использованы для улучшения здоровья, является этически обоснованным, даже если врач раскрывает эти данные другому врачу. Однако, когда те же данные передаются маркетинговому агентству, как это только что произошло с британской национальной системой здравоохранения и компанией Google по производству искусственного интеллекта DeepMind, этические последствия становятся более неопределенными (Google DeepMind и здравоохранение в эпоху алгоритмов, Джулия Паулз и Хэл Ходсон). Конфиденциальность - это выбор контекста; какие данные передаются, кому, с какой целью и когда. Конфиденциальность в настоящее время не внедряется, возможно, потому, что личная власть и богатство, получаемые в результате отказа от этого, действуют как сдерживающий фактор как для частных компаний, так и для правительств. Кроме того, использование данных для измерения фактического социального воздействия может выявить неэффективность, которая будет неудобна для вовлеченных политиков или претензий компаний.

Публичные дебаты о конфиденциальности часто несправедливо заслоняются чрезмерно упрощенным бинарным выбором между конфиденциальностью и научным прогрессом. Маркетинговые кампании даже отвергли критику централизованного сбора данных как сопротивление прогрессу и цепляние за прошлое. Однако выгоды от научного прогресса с помощью данных могут быть достигнуты в соответствии с ценностями конфиденциальности, как это исторически было в эпидемиологических исследованиях. Извлечение ценности из данных без ущерба для конфиденциальности личных данных, безусловно, возможно технологически; например, путем использования гомоморфного шифрования и алгоритмического проектирования, что затрудняет обратное проектирование.

Гомоморфное шифрование позволяет объединять различные службы в цепочки, не предоставляя данные каждой из служб. Даже инженеры-программисты, работающие над программным обеспечением, не смогут переопределить пользователя. Гомоморфные схемы шифрования гибки по своей конструкции, что означает, что их можно использовать в среде облачных вычислений, обеспечивая при этом конфиденциальность обрабатываемых данных. Этот метод позволяет выполнять аналитические вычисления над зашифрованным текстом, тем самым генерируя зашифрованные результаты, которые при расшифровке соответствуют результатам операций, выполненных в виде обычного текста.

Результаты аналитики могут быть представлены таким образом, чтобы соответствовать цели без ущерба для конфиденциальности личных данных. Например, продажа данных, в которой говорится, что "20% жителей Амстердама едят мюсли на завтрак", передаст аналитическую ценность данных без ущерба для конфиденциальности, в то время как утверждение, что "Ана ест мюсли на завтрак", не будет поддерживать конфиденциальность. Алгоритмический дизайн и размер группы выборки имеют решающее значение для минимизации возможностей для обратного проектирования статистики и отслеживания целевых лиц. Одним из технических решений обратного проектирования агрегированных показателей является введение поддельных точек данных о вымышленных людях, которые не изменяют конечный результат, например процент группы, которая ест мюсли.

Конфиденциальность была представлена как ограничение использования данных, которое также может считаться неэтичным. Например, совместное использование медицинских данных может пролить свет на причины заболеваний, последствия лечения и может позволить проводить индивидуальные анализы, основанные на потребностях отдельных лиц.[7] Это имеет важное значениеэтическое значение в области этики больших данных, потому что, хотя многие ценят конфиденциальность, возможности обмена данными также весьма ценны, хотя они могут противоречить чьей-либо концепции конфиденциальности. Отношение к совместному использованию данных может основываться на предполагаемой потере контроля над данными и страхе перед использованием личных данных. Тем не менее, можно извлечь ценность данных без ущерба для конфиденциальности.

Некоторые ученые, такие как Джонатан Х. Кинг и Нил М. Ричардс, пересматривают традиционное значение конфиденциальности, а другие задаются вопросом, существует ли конфиденциальность по-прежнему. В статье 2014 года для the Wake Forest Law Review Кинг и Ричард утверждают, что конфиденциальность в эпоху цифровых технологий можно понимать не в терминахсекретности, но с точки зрения правил, которые регулируют и контролируют использование личной информации. В Европейском союзе Право быть забытым дает странам ЕС право принудительно удалять или удалять личные данные из баз данных по запросу человека, если информация считается неактуальной или устаревшей. По словам Эндрю Хоскинса, этот закон демонстрирует моральную панику членов ЕС по поводу предполагаемой потери конфиденциальности и способности управлять личными данными в эпоху цифровых технологий. В Соединенных Штатах граждане имеют право удалять добровольно предоставленные данные. Это сильно отличается от права быть забытым, потому что большая часть данных, полученных с использованием технологий и платформ больших данных, не передается добровольно.

Валюта[править]

Бизнес-модели, движущие технологическими гигантами, открыли возможность превращения человеческой личности в продукт для потребления. В то время как технические услуги, включая поисковые системы, каналы связи и карты, предоставляются бесплатно, новой валютой, которая была обнаружена в процессе, являются персональные данные.

Существует множество мнений о том, этично ли получать деньги в обмен на доступ к личным данным. Были проведены параллели между донорством крови, когда уровень заражения донорской крови снижается, когда нет финансовых транзакций для донора крови. Дополнительные вопросы возникают вокруг того, кто должен получать прибыль от транзакции с данными?

Сколько стоят данные?[править]

Каков курс обмена личных данных на деньги? Данные ценны, потому что они позволяют пользователям действовать более эффективно, чем когда они предполагают или действуют методом проб и ошибок. Есть два элемента данных, которые имеют ценность: тенденции и данные в реальном времени. Накопление исторических данных позволяет нам делать прогнозы на будущее на основе тенденций. Данные в реальном времени имеют ценность, потому что действия могут быть выполнены мгновенно.

Сколько на самом деле стоят технические услуги, такие как поисковая система, канал связи и цифровая карта, например, в долларах? Разница в стоимости услуг, предоставляемых технологическими компаниями, и акционерной стоимости этих технологических компаний - это разница в обменном курсе, предлагаемом гражданину, и "рыночном курсе" стоимости их данных. С научной точки зрения в этом элементарном расчете есть много пробелов: финансовые показатели компаний, уклоняющихся от уплаты налогов, ненадежны, будет ли доход или прибыль более подходящими, как определяется пользователь, для того, чтобы данные были ценными, требуется большое количество людей, будет ли установлена многоуровневая цена для разныхлюди в разных странах, не все доходы Google поступают от Gmail и т. Д. Хотя эти расчеты, несомненно, являются грубыми, упражнение помогает сделать денежную ценность данных более ощутимой. Другой подход заключается в поиске ставок обмена данными на черном рынке. RSA ежегодно публикует список покупок по кибербезопасности, в котором используется этот подход. Приведенные примеры охватывают только конкретные случаи, но если мы распространим прибыль от продажи данных на другие области, такие как здравоохранение, ежемесячная прибыль на человека увеличится.

Это поднимает экономический вопрос о том, являются ли бесплатные технические услуги в обмен на персональные данные целесообразным неявным обменом для потребителя. В модели торговли персональными данными вместо компаний, продающих данные, владелец может продавать свои персональные данные и получать прибыль. Торговля персональными данными - это структура, которая дает людям возможность владеть своей цифровой идентификацией и заключать подробные соглашения об обмене данными через Интернет. Вместо нынешней модели, которая допускает компании, продающие персональные данные с целью получения прибыли, при торговле личными данными частные лица будут продавать свои персональные данные известным лицам по своему выбору и получать прибыль. В основе лежит попытка повторно децентрализовать Интернет. Вместо нынешней модели, которая допускает компании, продающие персональные данные с целью получения прибыли, при торговле личными данными отдельные люди будут напрямую владеть и сознательно продавать свои персональные данные известным лицам по своему выбору и получать прибыль. Торговля персональными данными добавляет четвертый механизм распределения богатства, остальные три - заработная плата через рабочие места, собственность и собственность компании. Конечными целями модели торговли персональными данными являются: более справедливое распределение глобальных ресурсов и более сбалансированное распределение глобальных ресурсов. Торговля личными данными отдельными лицами в предлагаемой структуре приведет к распределению прибыли среди населения, но также может иметь радикальные последствия для властных структур общества. В настоящее время широко признано, что нынешняя централизованная структура данных усугубляет идеологические эхо-камеры и имеет далеко идущие последствия для, казалось бы, не связанных между собой процессов принятия решений, таких как выборы. Курс обмена данными имеет не только денежное, но и идеологическое значение. Должны ли нарушаться институциональные процессы из-за централизованного использования средств коммуникации, управляемых свободно собираемыми личными данными?

Хотя изначально реалистично предположить, что данные будут продаваться за деньги, можно представить будущее, в котором данные будут продаваться за данные. Сценарий "Я покажу тебе твое, если ты покажешь мое" может полностью заменить деньги. Важно отметить, что это сценарий будущего, и первым шагом является сосредоточение внимания на обмене личных данных на существующую денежную валюту.

Открытость[править]

Идея открытых данных основана на аргументе, что данные должны быть в свободном доступе и не должны иметь ограничений, которые запрещали бы их использование, таких как законы об авторском праве. По состоянию на 2014 год многие правительства начали переходить к публикации открытых наборов данных с целью прозрачности и подотчетности.[12] Это движение набрало обороты благодаря "активистам открытых данных", которые призвали правительства сделать доступными наборы данных, чтобы позволить гражданам самим извлекать смысл из данных и выполнять проверкии уравновешивают сами себя.[12][5] Кинг и Ричардс утверждают, что этот призыв к прозрачности включает в себя противоречие между открытостью и секретностью.

Активисты и ученые также утверждают, что, поскольку эта модель оценки данных с открытым исходным кодом основана на добровольном участии, доступность открытых наборов данных оказывает демократизирующее воздействие на общество, позволяя любому гражданину участвовать в нем Для некоторых доступность определенных типов данных рассматривается как право инеотъемлемая часть гражданской инициативы.

Фонд открытых знаний (OKF) перечисляет несколько типов наборов данных, которые должны предоставляться правительствами, чтобы они действительно были открытыми. У OFK есть инструмент под названием Глобальный индекс открытых данных (GODI), который представляет собой краудсорсинговый опрос для измерения открытости правительств,согласно Открытому определению. Цель GODI - предоставить инструмент для предоставления важной обратной связи правительствам о качестве их открытых наборов данных.

Готовность делиться данными варьируется от человека к человеку. Были проведены предварительные исследования факторов, определяющих готовность делиться данными. Например, некоторые предполагают, что бэби-бумеры менее охотно делятся данными, чем миллениалы.

Роль институтов[править]

Национальные государства[править]

Суверенитет данных относится к контролю правительства над данными, которые генерируются и собираются внутри страны. Проблема суверенитета данных обострилась, когда Эдвард Сноуден передал правительству США информацию о ряде правительств и частных лиц, за которыми правительство США шпионило. Это побудило многие правительствапересмотреть свой подход к суверенитету данных и безопасности данных своих граждан.

Дж. Де Йонг-Чен указывает, как ограничение потока данных может препятствовать научным открытиям, в ущерб многим, но особенно развивающимся странам.[17] Это вызывает серьезную озабоченность у этики больших данных из-за напряженности между двумя важными проблемами кибербезопасности и глобального развития.

Банки[править]

Банки занимают положение в обществе как хранители ценностей. Их политика в области обработки данных не должна ставить под угрозу доверительные отношения со своими клиентами как хранителями ценностей. Например, если банк делится данными об одном мяснике с другим мясником, это может поставить под угрозу их доверительные отношения из-за раскрытия данных конкурентам.

Актуальные новости об этике данных[править]

Разоблачения Эдварда Сноудена 5 июня 2013 года стали поворотным моментом в общественных дебатах по этике данных. Продолжающаяся публикация просочившихся документов раскрыла ранее неизвестные детали глобального аппарата наблюдения, которым управляет АНБ США в тесном сотрудничестве с тремя из его партнеров Five Eyes: австралийским ASD, британским GCHQ и канадским CSEC.

В Нидерландах ING Bank сделал публичное заявление о своих намерениях в отношении использования данных.

Скандал с данными Facebook-Cambridge Analytica связан со сбором личных данных до, но, скорее всего, более 87 миллионов пользователей Facebook в попытке повлиять на мнение избирателей. Как голосование по Brexit в 2016 году, так и кампании 2015/6 американских политиков Дональда Трампа и Теда Круза заплатили Cambridge Analytica за использование информации из утечки данных для влияния на мнение избирателей.

Соответствующее законодательство об этике данных[править]

26 октября 2001 года в США вступил в силу Патриотический акт в ответ на широкую обеспокоенность американцев терактами 11 сентября. В целом, Патриотический акт проложил путь, позволяющий силам безопасности вести наблюдение за гражданами, подозреваемыми в причастности к террористическим актам.

25 мая 2018 года в Европейском союзе вступил в силу Общий регламент по защите данных 2016/679 (GDPR). GDPR решает вопросы прозрачности со стороны контролеров данных по отношению к лицам, именуемым субъектами данных, и необходимости получения разрешения от субъектов данных для обработки их персональных данных.

Смотрите также[править]

Читать[править]

ncbi.nlm.nih.gov/pmc/articles/PMC5138448/

Пруф[править]