Майнинг социальных сетей

Материал из wikixw
Перейти к навигации Перейти к поиску

Майнинг социальных медиа-это процесс получения больших данных из пользовательского контента на сайтах социальных сетей и мобильных приложениях с целью извлечения шаблонов, формирования выводов о пользователях и действия на основе информации, часто с целью рекламы пользователям или проведения исследований. Термин представляет собой аналогию процесса добычи ресурсов горной промышленности для редких минералов. Добыча полезных ископаемых требует от горнодобывающих компаний просеивать огромные количества сырой руды, чтобы найти драгоценные минералы; кроме того, добыча полезных ископаемых в социальных сетях требует анализа человеческих данных и автоматизированных программных программ для просеивания огромных объемов необработанных данных в социальных сетях, чтобы выявить закономерности и тенденции, касающиеся использования социальных сетей, поведения в интернете, обмена контентом, связей между отдельными лицами, поведения покупок в интернете и многое другое. Эти модели и тенденции представляют интерес для компаний, правительств и некоммерческих организаций, поскольку эти организации могут использовать эти модели и тенденции для разработки своих стратегий или внедрения новых программ, новых продуктов, процессов или услуг.

Майнинг социальных медиа использует ряд базовых понятий из области компьютерных наук, интеллектуального анализа данных, машинного обучения и статистики . Майнеры социальных сетей разрабатывают алгоритмы, пригодные для исследования массивных файлов данных социальных сетей. Майнинг социальных медиа основан на теориях и методологиях из анализа социальных сетей , сетевой науки , социологии , этнографии , оптимизации и математики. Он включает в себя инструменты для формального представления, измерения и моделирования значимых моделей из крупномасштабных данных социальных сетей. В 2010-е годы крупные корпорации, правительства и некоммерческие организации занимались майнингом социальных сетей для получения данных о клиентах, клиентах и гражданах.

Фон[править]

По определению Каплана и Хенлейна, социальные медиа-это "группа интернет-приложений, которые строятся на идеологических и технологических основах Web 2.0 и которые позволяют создавать и обмениваться пользовательским контентом."Есть много категорий социальных медиа, включая, но не ограничиваясь, социальных сетей (Facebook или в LinkedIn), микроблоги (Твиттер), обмена фотографиями (Flickr, Одноклассники, Instagram, фоторедактор, или в Picasa), сбора новостей (Гугл ридер, группа, или сайт FeedBurner), видео (с YouTube, Metacafe и), livecasting (эфира или Twitch.tv), виртуальные миры (Канева), социальные игры (World of Warcraft ), социальный поиск (Google, Bing, or Ask.com ), и обмен мгновенными сообщениями (Google Talk, Skype или Yahoo! messenger).

Первый сайт в социальных сетях был представлен компанией GeoCities в 1994 году. Это позволило пользователям создавать свои собственные домашние страницы, не имея сложных знаний о кодировании HTML. Первый сайт социальной сети, SixDegrees.com, был введен в 1997 году. С тех пор были введены многие другие сайты социальных сетей, каждый из которых предоставляет услуги миллионам людей. Эти индивиды образуют виртуальный мир, в котором индивиды (социальные атомы), сущности (контент, сайты и т. д.) и взаимодействия (между индивидами, между сущностями, между индивидами и сущностями) сосуществуют. Социальные нормы и человеческое поведение управляют этим виртуальным миром. Понимая эти социальные нормы и модели человеческого поведения и сочетая их с наблюдениями и измерениями этого виртуального мира, можно систематически анализировать и добывать социальные медиа. Майнинг социальных медиа-это процесс представления, анализа и извлечения значимых паттернов из данных в социальных сетях, возникающих в результате социальных взаимодействий. Это междисциплинарная область, охватывающая методы из области компьютерных наук, интеллектуального анализа данных, машинного обучения, анализа социальных сетей, сетевой науки, социологии, этнографии, статистики, оптимизации и математики. Майнинг социальных сетей сталкивается с большими проблемами, такими как парадокс больших данных, получение достаточных выборок, ошибка удаления шума и дилемма оценки. Майнинг социальных сетей представляет виртуальный мир социальных сетей в вычислимом виде, измеряет его и разрабатывает модели, которые могут помочь нам понять его взаимодействие. Кроме того, social media mining предоставляет необходимые инструменты для добычи в этом мире интересных паттернов, анализа распространения информации, изучения влияния и гомофилии, предоставления эффективных рекомендаций и анализа нового социального поведения в социальных сетях.

Использует[править]

Майнинг социальных сетей используется в нескольких отраслях, включая развитие бизнеса, исследования в области социальных наук, медицинские услуги и образовательные цели. После того , как полученные данные проходят через анализ социальных сетей, они могут быть применены к этим различным областям. Часто компании используют паттерны связности, которые пронизывают социальные сети, такие как ассортативность—социальное сходство между пользователями, вызванное влиянием, гомофилией, а также взаимностью и транзитивностью. эти силы затем измеряются с помощью статистического анализа узлов и связей между этими узлами. Социальная аналитика также использует анализ настроений, поскольку пользователи социальных сетей часто передают положительные или отрицательные настроения в своих сообщениях. это обеспечивает важную социальную информацию об эмоциях пользователей по конкретным темам.

Эти три паттерна имеют несколько применений помимо чистого анализа. Например, влияние может быть использовано для определения наиболее влиятельного пользователя в конкретной сети. компании будут заинтересованы в этой информации, чтобы решить, кого они могут нанять для маркетинга влияния . Эти факторы влияния определяются распознаванием, генерированием активности и новизной—тремя требованиями, которые могут быть измерены с помощью данных, полученных с этих сайтов. аналитики также оценивают показатели гомофилии: склонность двух сходных индивидов становиться друзьями. Пользователи начали полагаться на информацию мнений других пользователей, чтобы понять разнообразную тематику. эти анализы могут также помочь разработать рекомендации для отдельных лиц в специально подобранном качестве. путем измерения влияния и гомофилии, онлайн и оффлайн компании могут предлагать конкретные продукты для отдельных потребителей и групп потребителей. Социальные сети могут сами использовать эту информацию, чтобы предложить своим пользователям возможных друзей, чтобы добавить, страницы, чтобы следовать, и учетные записи для взаимодействия.

Исследование[править]

Области исследований[править]

  • Обнаружение событий в социальных сетях-Социальные сети позволяют пользователям свободно общаться друг с другом и делиться своими последними новостями, текущей деятельностью или мнениями по различным темам. В результате они могут рассматриваться как потенциально жизнеспособный источник информации для понимания текущих возникающих тем / событий.
  • Мониторинг и надзор за общественным здравоохранением-использование крупномасштабного анализа социальных сетей для изучения больших групп пациентов и широкой общественности, например, для получения сигналов раннего предупреждения о взаимодействии между лекарственными средствами и неблагоприятных реакциях на лекарственные средства или понимания репродукции человека и сексуального интереса.
  • Структура сообщества (обнаружение/эволюция/оценка сообщества) – определение сообществ в социальных сетях, как они развиваются, и оценка идентифицированных сообществ, часто без обоснованной истины.
  • Сетевые меры-измерение центральности, транзитивности, взаимности, баланса, статуса и сходства в социальных сетях.
  • Сетевые модели-имитация сетей с определенными характеристиками. Примеры включают случайные графики (модели E-R), модели предпочтительных вложений и модели малого мира.
  • Информационный каскад-анализ распространения информации на сайтах социальных сетей. Примеры включают стадное поведение, информационные каскады, распространение инноваций и эпидемические модели.
  • Влияние и гомофилия-измерительная сетевая ассортативность и измерительно-моделирующее влияние и гомофилия.
  • Рекомендация в социальных сетях-рекомендация друзей или предметов на сайтах социальных сетей.
  • Социальный поиск-поиск информации в социальной сети.
  • Анализ настроений в социальных сетях-определение коллективно субъективной информации, например, положительной и отрицательной, из данных социальных сетей.
  • Social spammer detection-обнаружение социальных спамеров, которые отправляют нежелательный спам-контент, появляющийся в социальных сетях и любом веб-сайте с пользовательским контентом для целевых пользователей, часто подтверждающих, чтобы повысить их социальное влияние, легитимность, доверие.
  • Выбор функций с помощью функции преобразования данных в социальных сетях, чтобы использовать возможности социальных сетей.
  • Доверие в социальных медиа-изучение и понимание доверия в социальных медиа.
  • Недоверие и негативные ссылки-изучение негативных ссылок в социальных сетях.
  • Роль социальных сетей в кризисных ситуациях-социальные сети продолжают играть важную роль во время кризисов, в частности Twitter. исследования показывают, что можно обнаружить землетрясения и слухи , используя твиты, опубликованные во время кризиса. Разработка инструментов, помогающих первым респондентам анализировать твиты для лучшего реагирования на кризисы , и разработка методов, обеспечивающих им более быстрый доступ к соответствующим твитам , является активной областью исследований.
  • Location-based social network mining-интеллектуальная мобильность человека для персонализированной рекомендации POI по социальным сетям на основе местоположения.
  • Происхождение информации в социальных сетях-Provenance информирует пользователя об источниках данной информации. Социальные сети могут помочь в определении происхождения информации из-за ее уникальных особенностей: пользовательский контент, профили пользователей, взаимодействия пользователей и пространственная или временная информация.
  • Управление уязвимостью-уязвимостью пользователя на сайтах социальных сетей можно управлять в три последовательных этапа:

(1) выявление новых способов, с помощью которых пользователь может быть уязвимым,

(2) количественная оценка или измерение уязвимости пользователя, и

(3) сокращение или смягчение их.

Места публикации[править]

Социальные медиа майнинг научные статьи публикуются в области компьютерных наук, социальных наук и интеллектуального анализа данных конференций и журналов:

Конференции[править]

Материалы конференции можно найти в сборнике трудов по знаниям Обнаружение и интеллектуальный анализ данных (KDD), Всемирная паутина (WWW), Ассоциация для компьютерной лингвистики (ACL), конференция по информации и управление знаниями (CIKM), Международная конференция по данным Минирование (ICDM), конференция Интернета измеряя (IMC).

  • Конференция KDD-ACM SIGKDD конференция по открытию знаний и интеллектуальному анализу данных
  • WWW Conference-Международная конференция по всемирной паутине
  • WSDM Conference-ACM конференция по веб-поиску и интеллектуальному анализу данных
  • Конференция CIKM - ACM Conference on Information and Knowledge Management
  • Конференция ICDM - IEEE International Conference on Data Mining
  • Ассоциация компьютерной лингвистики (ACL)
  • Интернет-измерительная конференция (IMC)
  • Международная конференция по вопросам интернета и социальных сетей (ICWSM)
  • Международная конференция по социальным медиа и обществу
  • Международная конференция по веб-инжинирингу (ICWE)
  • Европейская конференция по машинному обучению и принципам и практике обнаружения знаний в базах данных (ECML / PKDD),
  • Международные совместные конференции по искусственному интеллекту (IJCAI),
  • Ассоциация содействия развитию искусственного интеллекта (AAAI),
  • Рекомендательные Системы (RecSys)
  • Взаимодействие компьютера и человека (ОМС)
  • Социальные вычисления поведенческое-культурное моделирование и прогнозирование (SBP).
  • HT Conference-ACM конференция по Гипертексту
  • SDM Conference-SIAM Международная конференция по интеллектуальному анализу данных ( SIAM)
  • PAKDD Conference-ежегодная Тихоокеанско-Азиатская конференция по открытию знаний и интеллектуальному анализу данных

Журналы[править]

  • Конференция DMKD - исследовательские вопросы по интеллектуальному анализу данных и открытию знаний
  • Конференция ECML-PKDD-Европейская конференция по машинному обучению и принципам и практике обнаружения знаний в базах данных
  • IEEE транзакции по инженерии знаний и данных (TKDE),
  • ACM транзакции по обнаружению знаний из данных (TKDD)
  • Операции ACM по интеллектуальным системам и технологиям (TIST)
  • Анализ и майнинг социальных сетей (SNAM)
  • Системы знаний и информации (Кис)
  • ACM транзакции в Интернете (TWEB)
  • Журнал Всемирной Паутины
  • Социальные связи
  • Интернет-Математика
  • Интеллектуальные системы IEEE
  • Sigkdd Exploration.

Майнинг социальных медиа также присутствует на многих конференциях по управлению данными / базами данных, таких как конференция ICDE, конференция SIGMOD и Международная конференция по очень большим базам данных .

Смотрите также[править]

Методы

Предметные области

Компании

Смежные темы

Пруф[править]

dmml.asu.edu/smm/