Редактирование: Большие данные
Перейти к навигации
Перейти к поиску
Правка может быть отменена. Пожалуйста, просмотрите сравнение версий ниже, чтобы убедиться, что это нужная вам правка, и запишите страницу ниже, чтобы отменить правку.
Текущая версия | Ваш текст | ||
Строка 265: | Строка 265: | ||
Большие данные-это модное слово и "неопределенный термин", [208] [209] но в то же время "одержимость" предпринимателями, консультантами, учеными и средствами массовой информации. Большие витрины данных, такие как Google Flu Trends, не смогли обеспечить хорошие прогнозы в последние годы, завышая вспышки гриппа в два раза. Точно так же, премия Академии наук и предвыборные прогнозы, основанные исключительно на Твиттере, чаще ошибались, чем были нацелены. Большие данные часто создают те же проблемы, что и малые данные; добавление большего количества данных не решает проблемы предвзятости, но может подчеркнуть другие проблемы. В частности, такие источники данных, как Twitter, не являются репрезентативными для всего населения, и результаты, полученные из таких источников, могут привести к неверным выводам. Google Translate—который основан на статистическом анализе больших данных текста-делает хорошую работу при переводе веб-страниц. Однако результаты из специализированных доменов могут быть резко искажены. С другой стороны, большие данные могут также привести к возникновению новых проблем, таких как проблема множественных сравнений : одновременное тестирование большого набора гипотез, вероятно, приведет к получению многих ложных результатов, которые ошибочно кажутся значимыми. Иоаннидис утверждал ,что " большинство опубликованных результатов исследований являются ложными " из – за по существу того же самого эффекта: когда многие научные группы и исследователи каждый выполняют много экспериментов (т. е. обрабатывают большое количество научных данных; хотя и не с технологией больших данных), вероятность того, что "значительный" результат будет ложным, быстро растет-тем более, когда публикуются только положительные результаты. Кроме того, результаты анализа больших данных настолько же хороши, как и модель, на которой они основаны. Например, big data с разной степенью успеха принимали участие в попытках предсказать результаты президентских выборов 2016 года в США . | Большие данные-это модное слово и "неопределенный термин", [208] [209] но в то же время "одержимость" предпринимателями, консультантами, учеными и средствами массовой информации. Большие витрины данных, такие как Google Flu Trends, не смогли обеспечить хорошие прогнозы в последние годы, завышая вспышки гриппа в два раза. Точно так же, премия Академии наук и предвыборные прогнозы, основанные исключительно на Твиттере, чаще ошибались, чем были нацелены. Большие данные часто создают те же проблемы, что и малые данные; добавление большего количества данных не решает проблемы предвзятости, но может подчеркнуть другие проблемы. В частности, такие источники данных, как Twitter, не являются репрезентативными для всего населения, и результаты, полученные из таких источников, могут привести к неверным выводам. Google Translate—который основан на статистическом анализе больших данных текста-делает хорошую работу при переводе веб-страниц. Однако результаты из специализированных доменов могут быть резко искажены. С другой стороны, большие данные могут также привести к возникновению новых проблем, таких как проблема множественных сравнений : одновременное тестирование большого набора гипотез, вероятно, приведет к получению многих ложных результатов, которые ошибочно кажутся значимыми. Иоаннидис утверждал ,что " большинство опубликованных результатов исследований являются ложными " из – за по существу того же самого эффекта: когда многие научные группы и исследователи каждый выполняют много экспериментов (т. е. обрабатывают большое количество научных данных; хотя и не с технологией больших данных), вероятность того, что "значительный" результат будет ложным, быстро растет-тем более, когда публикуются только положительные результаты. Кроме того, результаты анализа больших данных настолько же хороши, как и модель, на которой они основаны. Например, big data с разной степенью успеха принимали участие в попытках предсказать результаты президентских выборов 2016 года в США . | ||
==Смотрите также== | ==Смотрите также== | ||
Список компаний и инструментов см. Также в разделе категория: Большие данные . | Список компаний и инструментов см. Также в разделе категория: Большие данные . |