Редактирование: Большие данные

Перейти к навигации Перейти к поиску
Внимание: Вы не вошли в систему. Ваш IP-адрес будет общедоступен, если вы запишете какие-либо изменения. Если вы войдёте или создадите учётную запись, её имя будет использоваться вместо IP-адреса, наряду с другими преимуществами.

Правка может быть отменена. Пожалуйста, просмотрите сравнение версий ниже, чтобы убедиться, что это нужная вам правка, и запишите страницу ниже, чтобы отменить правку.

Текущая версия Ваш текст
Строка 226: Строка 226:
Семинары по алгоритмам для современных массивных наборов данных (MMDS) объединяют ученых-компьютерщиков, статистиков, математиков и практиков анализа данных для обсуждения алгоритмических проблем больших данных. что касается больших данных, то нужно иметь в виду, что такие понятия величины относительны. Как говорится "если прошлое имеет какое-либо руководство, то сегодняшние большие данные, скорее всего, не будут рассматриваться как таковые в ближайшем будущем."
Семинары по алгоритмам для современных массивных наборов данных (MMDS) объединяют ученых-компьютерщиков, статистиков, математиков и практиков анализа данных для обсуждения алгоритмических проблем больших данных. что касается больших данных, то нужно иметь в виду, что такие понятия величины относительны. Как говорится "если прошлое имеет какое-либо руководство, то сегодняшние большие данные, скорее всего, не будут рассматриваться как таковые в ближайшем будущем."


===Выборка больших данных===
==Выборка больших данных==


Важный исследовательский вопрос, который можно задать о больших наборах данных, заключается в том, нужно ли вам смотреть на полные данные, чтобы сделать определенные выводы о свойствах данных, или это достаточно хороший образец. Само название big data содержит термин, связанный с размером, и это является важной характеристикой больших данных. Но выборка (статистика) позволяет выбрать правильные точки данных из большего набора данных для оценки характеристик всей совокупности. Например, существует около 600 миллионов твитов, производимых каждый день. Стоит ли смотреть на все из них, чтобы определить темы, которые обсуждаются в течение дня? Нужно ли смотреть на все твиты, чтобы определить настроение по каждой из тем? В производстве различных типов сенсорных данных, таких как акустика, вибрация, давление, ток, напряжение и данные контроллера доступны в короткие промежутки времени. Для прогнозирования простоя может не потребоваться рассматривать все данные, но образец может быть достаточным. Большие данные могут быть разбиты на различные категории точек данных, такие как демографические, психографические, поведенческие и транзакционные данные. Имея большой набор точек данных, маркетологи могут создавать и использовать более специализированные сегменты потребителей для более стратегического таргетирования.
Важный исследовательский вопрос, который можно задать о больших наборах данных, заключается в том, нужно ли вам смотреть на полные данные, чтобы сделать определенные выводы о свойствах данных, или это достаточно хороший образец. Само название big data содержит термин, связанный с размером, и это является важной характеристикой больших данных. Но выборка (статистика) позволяет выбрать правильные точки данных из большего набора данных для оценки характеристик всей совокупности. Например, существует около 600 миллионов твитов, производимых каждый день. Стоит ли смотреть на все из них, чтобы определить темы, которые обсуждаются в течение дня? Нужно ли смотреть на все твиты, чтобы определить настроение по каждой из тем? В производстве различных типов сенсорных данных, таких как акустика, вибрация, давление, ток, напряжение и данные контроллера доступны в короткие промежутки времени. Для прогнозирования простоя может не потребоваться рассматривать все данные, но образец может быть достаточным. Большие данные могут быть разбиты на различные категории точек данных, такие как демографические, психографические, поведенческие и транзакционные данные. Имея большой набор точек данных, маркетологи могут создавать и использовать более специализированные сегменты потребителей для более стратегического таргетирования.


Была проделана определенная работа в области алгоритмов выборки больших данных. Разработана теоретическая формулировка для выборки данных Twitter.
Была проделана определенная работа в области алгоритмов выборки больших данных. Разработана теоретическая формулировка для выборки данных Twitter.
==Критика==
==Критика==


Пожалуйста, учтите, что любой ваш вклад в проект «wikixw» может быть отредактирован или удалён другими участниками. Если вы не хотите, чтобы кто-либо изменял ваши тексты, не помещайте их сюда.
Вы также подтверждаете, что являетесь автором вносимых дополнений, или скопировали их из источника, допускающего свободное распространение и изменение своего содержимого (см. Wikixw:Авторские права). НЕ РАЗМЕЩАЙТЕ БЕЗ РАЗРЕШЕНИЯ ОХРАНЯЕМЫЕ АВТОРСКИМ ПРАВОМ МАТЕРИАЛЫ!

  <charinsert>[+]</charinsert> · <charinsert>+</charinsert> · <charinsert>+</charinsert> · <charinsert>✔ Оставить</charinsert> · <charinsert>– —</charinsert> · <charinsert>“+” ‘+’ «+» ‹+› „+“ ‚+‘</charinsert> · <charinsert>… ~ | °  </charinsert> · <charinsert>≈ ≠ ≤ ≥ ± − × ÷ ← → ² ³ ½ · §</charinsert>
     <charinsert></charinsert> · <charinsert>File:+</charinsert> · <charinsert>Special:MyLanguage/+</charinsert> · <charinsert>Special:MyLanguage/</charinsert> · <charinsert>+</charinsert> · <charinsert><nowiki>+</nowiki></charinsert> <charinsert><nowiki>+</nowiki></code></charinsert> · <charinsert><syntaxhighlight lang="php">+</syntaxhighlight></charinsert> · <charinsert></charinsert> · <charinsert>+</charinsert> · <charinsert>#REDIRECT+</charinsert> · <charinsert><translate>+</translate></charinsert> · <charinsert><languages/></charinsert> · <charinsert>{{#translation:}}</charinsert> · <charinsert><tvar name=1>+</tvar></charinsert> · <charinsert>{{DEFAULTSORT:+}}</charinsert> · <charinsert>+</charinsert>