IoB

Материал из wikixw
Версия от 19:09, 9 декабря 2022; Cc82737 viki (обсуждение | вклад) (Новая страница: «Ещё пару десятков лет назад бизнес-стратегии выстраивались на основании данных, полученных в результате маркетинговых исследований — качественных, в процессе которых появлялось представление о реакции потребителя на продукт, и количественных, позв...»)
(разн.) ← Предыдущая версия | Текущая версия (разн.) | Следующая версия → (разн.)
Перейти к навигации Перейти к поиску

Ещё пару десятков лет назад бизнес-стратегии выстраивались на основании данных, полученных в результате маркетинговых исследований — качественных, в процессе которых появлялось представление о реакции потребителя на продукт, и количественных, позволяющих определить емкость рынка, средний возраст ядра целевой аудитории и другие параметры.

С развитием интернета процесс сбора и обработки данных претерпел трансформацию: появились целостные экосистемы — «интернет вещей» (IoT) и «интернет данных». Они значительно облегчили работу маркетологов и стратегов, однако результаты их были максимально приближены к результатам количественных исследований. И, отвечая на вопрос «Сколько?», они не отвечали на вопрос «Почему?» — интерпретация данных продолжала осуществляться в ручном режиме человеком и оставаться субъективной.

IoB Эволюция интернета

Внутреннее–внешнее-начало (разметка)

Логичным продолжением эволюции интернета стало появление объединенной системы, которая трактует собранные данные с точки зрения поведенческой психологии — это и называется «интернет поведения» или Internet of behaviors (IoB). Описание концепции и термин впервые появились в 2012 году в блоге вышедшего на пенсию профессора Хельсинкского университета Готе Найман. Спустя восемь лет IoB становится не просто теорией, а трендом.

Примечание В прогнозе на 2021 год исследовательская компания Gartner объявила «интернет поведения» одной из десяти основных стратегических технологических тенденций, «которые ИТ-специалисты не могут игнорировать».


Формат IOB (сокращение от inside, outside, beginning), также обычно называемый форматом BIO, является распространенным форматом тегов для пометки токенов в задаче разделения на фрагменты в компьютерной лингвистике (например, распознавание именованных объектов).Он был представлен Рамшоу и Маркусом в их статье "Разбиение текста на фрагменты с использованием обучения на основе преобразования", 1995 Префикс I перед тегом указывает, что тег находится внутри фрагмента. Тег O указывает, что токен не принадлежит ни одному чанку. Префикс B перед тегом указывает на то, что тег является началомфрагмент, который сразу следует за другим фрагментом без тегов O между ними. Используется только в этом случае: когда фрагмент идет после тега O, первый токен фрагмента принимает префикс I-.

Другим подобным форматом, который широко используется, является формат IOB2, который совпадает с форматом IOB, за исключением того, что B-тег используется в начале каждого фрагмента (т. Е. Все фрагменты начинаются с B-тега).

Понятное введение в тегирование сущностей приведено в блоге Боба Карпентера "Coding Chunkers as Taggers"[3].

Пример с форматом IOB:

Алекс И-ПЕР

- это О
, переходящее из О
в О
Los I-LOC
Angeles I-LOC
in O
Калифорнийский I-LOC

Обратите внимание, что "Алекс", "Лос" и "Калифорния", хотя и являются первыми лексемами их фрагмента, имеют префикс "I-".

Тот же пример после фильтрации стоп–слов:

Алекс И-ПЕР

собирается О
Los I-LOC
Angeles I-LOC
Калифорнийский Би-ЛОК

Обратите внимание, что у "California" теперь есть префикс "B-", потому что он сразу следует за другим фрагментом LOC.

Тот же пример с форматом IOB2 (с тегированием, на которое не влияет фильтрация стоп-слов):

Алекс Би-ПЕР

- это О
, переходящий из О
в О
Los B-LOC
Angeles I-LOC
в О
Калифорнийский Би-ЛОК

Связанные схемы тегов иногда включают "НАЧАЛО / КОНЕЦ: это состоит из тегов B, E, I, S или O, где S используется для представления блока, содержащего один токен. Фрагменты длиной, большей или равной двум, всегда начинаются с тега B и заканчиваются тегом E"[4].

Другие схемы пометки включают BIOES / BILOU, где "E" и "L" обозначают последний или конечный символ такой последовательности, а "S" обозначает отдельный элемент или единичный элемент "U".

Пример с форматом BIOES:

Алекс С-ПЕР

О
собирается О
с О
Марти Би-ПЕР
A. Я-ПЕР
Рик Э-ПЕР
в О
Los B-LOC
Лос-Анджелес E-LOC
Критические замечания

Синтаксис IOB не допускает вложенности, поэтому не может (если не расширен) также представлять даже очень простые явления, такие как границы предложений (которые нетривиально надежно определить), объем вводимых в скобки выражений в предложениях, грамматические структуры, вложенные именованные объекты, такие как "Факультет компьютерных наук Университета Висконсина"и так далее. Это также не оставляет места для метаданных, таких как идентификатор для конкретной выборки, уровень достоверности присвоения NER и так далее, Которые являются обычным явлением в системах NLP.

Из-за этих ограничений данные часто приходится преобразовывать из формата IOB, или проекты должны создавать пользовательские расширения, что привело к появлению большого количества не совсем совместимых "IOB-подобных" форматов.

Пробел и буква "О" (означающие "не в любом фрагменте") не передают никакой информации и могут быть просто опущены. То же самое верно для добавления суффикса "type" к маркерам "I-" или "E-", как в некоторых вариантах "BIOES"; и для обозначения как "I", так и "E" (если вы начали, а не закончили, вы "в", и если вы "в", вы начали, а не закончили). Некоторые другие форматы используют детализацию для улучшения удобочитаемости и / или проверки ошибок, но, похоже, IOB не получает таких преимуществ в обмен на свою детализацию.

Значение IOB "один токен на строку" зависит от используемой токенизации, хотя токенизация не стандартизирована в NLP, и детали токенизации не должны быть связаны с представлениями NER. "31.11.2019" может содержать от одного до пяти токенов в разных системах, но NER один и тот же. Некоторые системы даже допускают пробелы внутри токенов, и пробел в качестве разделителя противоречит этому, сужая применимость IOB и стимулируя дополнительные расширения. "пробел" может включать или не включать табуляцию, множественные пробелы, жесткие пробелы и т. Д. Различия, Которые трудно обнаружить при вычитке.

Более мощные форматы (наиболее очевидно, XML и JSON) могут обрабатывать гораздо более разнообразные аннотации, имеют меньшие различия между реализациями, а также часто короче и более удобочитаемы. Например:

<PER>Алекс</PER> отправляется с <PER>Марти А. Риком </PER>в<LOC> Лос-Анджелес</LOC> XML занимает 80 байт для выполнения тех же действий, что и 91-байтовая версия BIOES, показанная выше, или 79-байтовая версия IOB. Однако он также может легко поддерживать границы предложений, аннотации частей речи и другие функции, обычно необходимые в системах NLP. Разбиение всех токенов в определенных местах не является строго частью задачи NER; но даже если бы каждый токен был помечен (например, "<T>is</T>"), общее количество увеличилось бы только до 139 байт:

<PER><T>Алекс</T></PER><T> собирается</T><T> с</T><PER><T>Марти</T><T>А.</T><T>Рик</T></PER><T> в</T><LOC><T>Лос</T><T>Анджелес</T></LOC>

Бизнес

Концепция IoB выглядит, на первый взгляд, как исполнившаяся мечта для многих компаний.

«Интернет поведения тела» дает возможность минимизировать расходы на маркетинг и рекламу, но без риска снижения объемов прибыли.

Желание максимально кастомизировать продукт или услугу легко реализуется при использовании результатов анализа данных, которые теперь считывают практически намерение потребителя.
Становится возможным действительно гибкое ценообразование, не ущемляющее интересов ни продавца, ни покупателя.
Значительно проще оптимизировать работу персонала, повысить эффективность рабочих процессов.
И это — только часть возможностей, становящихся доступными для крупного и малого бизнеса. Не менее важно, что использование «интернета поведения» сводит практически к нулю коммерческие риски при повторении событий, схожих с эпидемией COVID-19, поскольку значительно упрощает любые форматы дистанционного взаимодействия и управления.

Примеры

Internet of Behavior. Носимые устройства для детей и устройства «умный дом»

Примеров практического применения «интернета поведения тела» относительно немного, но тем шире возможности для внедрения.

По большей части IoB сегодня применяется маркетологами для оптимизации продукта или адресного сообщения потребителям: лидирует здесь Uber, детально отслеживающий множество поведенческих параметров. А Google, Facebook и YouTube используют поведенческие данные для демонстрации пользователям рекламы на своих платформах.

Единичными и не до конца раскрывшими свой потенциал случаями можно считать использование расширенных версий CRM, позволяющих не только ставить задачи и трекать начало и завершение работы над ними, но и получать комплексное представление о процессе работы каждого из сотрудников.

Во время пандемии технологии IoB широко использовались для выявления наличия или отсутствия маски и повышенной температуры тела: при помощи датчиков или RFID-меток отслеживались несоответствия в соблюдении протоколов безопасности.

Будущее

Эксперты и футуристы единогласно признают: развитие «интернета поведения» станет причиной эволюционных прорывов почти во всех сферах деятельности.

Медицина

ЧиП Internet of Behavior. Носимые устройства для взрослых

В этом направлении прогнозируют появление кардиостимуляторов, управляемых по Wi-Fi, и «умных линз», способных не только корректировать зрение, но и собирать данные о состоянии пациента при наличии у него хронических заболеваний. «Умная таблетка» или имплант позволят проводить мониторинг состояния здоровья, а интерфейс мозг-компьютер сможет помогать пациентам с нарушениями нейромышечной передачи.

Мода, архитектура и дизайн интерьеров

В пессимистичных прогнозах IoB ставит под удар сложившуюся систему обновления трендов, сезонности, модных цветов в интерьере или силуэтов в гардеробе, что грозит исчезновением целой индустрии. По оптимистичным прогнозам — он просто позволит еще более четко отделить массовый продукт, а высокую моду и разработку премиальных архитектурных и интерьерных решений возвести в ранг искусства.

Управление персоналом

Анализ содержания рабочего дня и отслеживание состояния работника в процессе, оценка поведения сотрудников при общении с клиентами, выявление потенциальных зон роста и интересов, на основе которых можно составлять индивидуальные программы обучения — эти и множество других возможностей привнесет «интернет поведения» в управление персоналом.Сокращение издержек на поиск и тестирование соискателей, минимизация «текучки» кадров, гибкое управление и, как следствие, высокая удовлетворенность персонала, профессиональные навыки которого можно «настраивать» под себя — только часть выгод, которые получит бизнес от внедрения IoB в HR-отрасль.

Туризм

Персонализированные подборки предложений по направлениям для поездок, времени вылета, отелям и экскурсионным программам повысят эффективность работы туроператоров и турагентств, а также степень удовлетворенности отдыхом у клиентов. Обслуживание эмоций туриста, работа с его впечатлениями, — то, что ранее могла обеспечить только эксклюзивная консьерж-служба, станет повседневной реальностью в сферах туризма и гостеприимства.

Автомобилестроение

Здесь, в первую очередь, «интернет поведения» позволит повысить качество ключевого показателя — безопасности. Впрочем, не менее привлекательно выглядит и возможность оптимизировать расходы на содержание автомобиля путем проведения анализа частоты и причин использования машины и моделей вождения.

Страховые компании

Сферу страхования тоже ждут изменения. Появится возможность определять цену страховки не на основании субъективных параметров типа пола, возраста и стажа, а на основе достоверных объективных данных. В свою очередь аккуратные водители, туристы и домовладельцы перестанут переплачивать, покрывая риски за менее аккуратных и ответственных.

IoB благотворно повлияет на UX и SEO, причем как облегчит работу специалистам этих отраслей, так и повысит удовлетворенность пользователей. Стриминговые сервисы будут предлагать зрителям то, что им действительно понравится, а не приблизительную подборку на основе общих данных. В кофейне гостю нальют тот кофе, которого хочется именно сейчас. И можно будет не пытаться больше угадать, что подарить на годовщину супруге или супругу — непременно появится стартап, который даст на 100% верные рекомендации.

Примечание

Еще в одном своем отчете Gartner прогнозирует, что к 2023 году отдельные действия 40% мирового населения будут отслеживаться в цифровом виде, чтобы влиять на наше поведение.

Потенциальные угрозы

Помимо неоспоримой пользы, «интернет поведения» привносит в жизнь людей и новые вызовы — прежде всего это касается безопасности данных, приватности и этики.

Кто может получить доступ к данным?

Преступники

Хакеры
Брокеры и центры объединения данных
Работодатели
Школы
Представители здравоохранения
Страховые компании
Производители
Система уголовного правосудия
Правительства
  • Что потенциально вызывает опасения?

Зависимость человека от устройств для здоровья (кардиостимуляторы, линзы, кохлеарные имплантаты) или функциональных целей (фитнес и любые другие трекеры, собирающие данные)

Сбор, хранение или распространение сенсорных данных
Подключение к Интернету
Отсутствие корректной нормативной базы
Аппаратное обеспечение
Программное обеспечение
  • Каковы возможные последствия?

Смерть человека или причинение физического вреда организму в результате неисправности, вызванной взломом<

Вызовы глобальной и национальной безопасности
Вмешательство в данные
Пассивный сбор или обмен данными без информированного согласия
Неправильное или неожиданное использование данных
Идентификация личности
Увеличение неравенства в отношении здоровья
Принуждение к использованию девайсов
Нарушение автономии тела

Где проходят границы допустимого и разумного сбора информации о персонале? Да, к примеру, более пристальное внимание к состоянию пилотов перед полетом способно защитить жизни нескольких сотен людей. Но что, если решение о состоянии принимается на основании данных о том, как пилот вчера провел свой законный выходной?Как обезопасить передачу данных при использовании устройств, управляемых по Wi-Fi? А если это — кардиостимулятор президента страны? Пока на эти вопросы нет ответов.Юристы по всему миру заявляют о несовершенстве нормативно-правовой базы. :В России Закон о персональных данных и Административный кодекс не удовлетворяют новым запросам: идентификация личности, осуществляемая IoB, по сути означает использование персональных данных без согласия пользователя. Отсутствие подобного регулирования способно привести к массовым злоупотреблениям в использовании информации.

+ Преимущества & - критика

«Интернет поведения тела» — своего рода технологическая революция. Наряду с массой потенциальных преимуществ, способных привести к взрывному росту во множестве отраслей и повысить уровень качества жизни людей, он может пугать наличием потенциальных недостатков, а кое-кому даже казаться реализованным сценарием антиутопии.

Вера Шибаева

продуктовый менеджер ML Space

См.также

IoT

Пруф

.youtube.com/watch?v=CXRtwNkp-3E