Юзабилити-тестирование

Материал из wikixw
Перейти к навигации Перейти к поиску

Юзабилити-тестирование-это метод, используемый в ориентированном на пользователя дизайне взаимодействия для оценки продукта путем тестирования его на пользователях. Это можно рассматривать как незаменимую практику юзабилити, поскольку она дает прямой вклад в то, как реальные пользователи используют систему. это контрастирует с методами проверки удобства использования, где эксперты используют различные методы, чтобы оценить пользовательский интерфейс, не вовлекая пользователей.

Испытание практичности фокусирует на измерять людск-сделанную емкость продукта соотвествовать своей предназначенной цели. Примерами продуктов, которые обычно выигрывают от тестирования юзабилити , являются продукты питания, потребительские товары, веб-сайты или веб-приложения , компьютерные интерфейсы, документы и устройства. Тестирование юзабилити измеряет юзабилити или простоту использования конкретного объекта или набора объектов, в то время как общие исследования взаимодействия человека и компьютера пытаются сформулировать универсальные принципы.

Что это не так[править]

Просто сбор мнений по объекту или документу-это исследование рынка или качественное исследование, а не тестирование юзабилити. Тестирование юзабилити обычно включает систематическое наблюдение в контролируемых условиях, чтобы определить, насколько хорошо люди могут использовать продукт.[2] однако, часто и качественное и юзабилити тестирование используются в комбинации, чтобы лучше понять мотивации/восприятие пользователей, в дополнение к их действиям.

Вместо того, чтобы показывать пользователям черновик и спрашивать: "Вы это понимаете?"юзабилити-тестирование предполагает наблюдение за тем, как люди пытаются использовать что-то по прямому назначению. Например, при тестировании инструкций по сборке игрушки испытуемым должны быть даны инструкции и коробка с деталями, и вместо того, чтобы их просили прокомментировать детали и материалы, их просят собрать игрушку вместе. Формулировка инструкции, качество иллюстрации и дизайн игрушки влияют на процесс сборки.

Методы[править]

Настройка теста юзабилити включает в себя тщательное создание сценария или реалистичной ситуации, в которой человек выполняет список задач, используя тестируемый продукт, в то время как наблюдатели смотрят и делают заметки ( динамическая проверка ). Несколько других инструментов тестирования, таких как инструкции по сценарию, прототипы бумаги и вопросники до и после тестирования , также используются для сбора отзывов о тестируемом продукте ( статическая проверка ). Например, чтобы проверить функцию вложения электронной почты программа, сценарий будет описывать ситуацию, когда человек должен отправить вложение электронной почты, и попросить его или ее взять на себя эту задачу. Цель состоит в том, чтобы наблюдать, как люди функционируют реалистично, чтобы разработчики могли видеть проблемные области и то, что людям нравится. Методы, широко используемые для сбора данных во время юзабилити-теста , включают протокол think aloud, совместное обучение и отслеживание глаз .

Тестирование прихожей[править]

Тестирование прихожей-это быстрый и дешевый метод юзабилити-тестирования, в котором случайным образом выбранных людей, например, проходящих по коридору, просят попробовать использовать продукт или услугу. Это может помочь проектировщикам определить "кирпичные стены", проблемы настолько серьезные, что пользователи просто не могут продвинуться на ранних стадиях нового дизайна. Может быть использован любой, кроме проектировщиков и инженеров (они, как правило, выступают в качестве "экспертов-рецензентов", потому что они слишком близки к проекту).

Удаленное тестирование юзабилити[править]

В сценарии, где оценщики юзабилити, разработчики и потенциальные пользователи находятся в разных странах и часовых поясах, проведение традиционной лабораторной оценки юзабилити создает проблемы как с точки зрения затрат, так и с точки зрения логистики. Эти проблемы привели к исследованиям по удаленной оценке удобства использования, с пользователем и оценщиками, разделенными по пространству и времени. Удаленное тестирование, которое облегчает проведение оценок в контексте других задач и технологий пользователя, может быть синхронным или асинхронным. Первый включает в себя связь в реальном времени один на один между оценщиком и Пользователем, в то время как второй включает в себя оценщика и пользователя, работающих отдельно. имеются многочисленные инструменты для удовлетворения потребностей обоих этих подходов.

Синхронные методы тестирования юзабилити включают в себя видеоконференции или используют удаленные инструменты совместного использования приложений, такие как WebEx. WebEx и GoToMeeting являются наиболее часто используемыми технологиями для проведения синхронного удаленного теста юзабилити. Однако синхронному удаленному тестированию может не хватать непосредственности и ощущения "присутствия", необходимого для поддержки процесса совместного тестирования. Кроме того, управление межличностной динамикой через культурные и языковые барьеры может потребовать подходов, учитывающих соответствующие культуры. Другие недостатки включают в себя снижение контроля над средой тестирования и отвлекающих факторов и перерывов, испытываемых участниками в их родной среде. одним из новых методов, разработанных для проведения синхронного удаленного теста юзабилити, является использование виртуальных миров.[6]

Асинхронные методологии включают в себя автоматический сбор пользовательских потоков кликов, журналы критических инцидентов, возникающих при взаимодействии с приложением, и субъективные отзывы пользователей об интерфейсе.[7] Подобно лабораторному исследованию, асинхронный тест удаленного использования основан на задачах, и платформа позволяет исследователям фиксировать клики и время выполнения задач. Таким образом, для многих крупных компаний, это позволяет исследователям лучше понять намерения посетителей при посещении веб-сайта или мобильного сайта. Кроме того, этот стиль пользовательского тестирования также дает возможность сегментировать обратную связь по демографическому, мировоззренческому и поведенческому типу. Испытания унесены в собственной окружающей среде потребителя (вернее чем лаборатории) помогая более далее сымитировать реальное испытание сценария. Такой подход также позволяет легко получить обратную связь от пользователей в отдаленных районах быстро и с меньшими организационными накладными расходами. В последние годы асинхронное тестирование юзабилити также стало распространенным и позволяет тестировщикам обеспечивать обратную связь в свободное время и не выходя из собственного дома.

Экспертная оценка[править]

Экспертная оценка - еще один общий метод юзабилити-тестирования. Как следует из названия, этот метод основан на привлечении экспертов с опытом работы в этой области (возможно, из компаний, специализирующихся на тестировании юзабилити) для оценки юзабилити продукта.

Эвристическая оценка или аудит юзабилити-это оценка интерфейса одним или несколькими экспертами по человеческим факторам. Оценщики измеряют удобство использования, эффективность и результативность интерфейса на основе принципов удобства использования, таких как эвристика удобства использования, первоначально определенная Якобом Нильсеном в 1994 году.[8]

Эвристика удобства использования Nielsen, которая продолжала развиваться в ответ на исследования пользователей и новые устройства, включает:

  • Видимость состояния системы
  • Матч между системой и реальным миром
  • Пользовательский контроль и свобода
  • Последовательность и стандарты
  • Предотвращение ошибок
  • Признание, а не отзыв
  • Гибкость и эффективность использования
  • Эстетичный и минималистичный дизайн
  • Помощь пользователям в распознавании, диагностике и восстановлении ошибок
  • Справка и документация

Автоматизированная экспертная оценка[править]

Подобно экспертным обзорам, автоматизированные экспертные обзоры обеспечивают тестирование юзабилити, но с использованием программ, заданных правилами для хорошего дизайна и эвристики. Несмотря на то, что автоматизированный обзор не может обеспечить такую же детализацию и понимание, как отзывы людей, они могут быть завершены более быстро и последовательно. Идея создания суррогатных пользователей для юзабилити-тестирования является амбициозным направлением для сообщества искусственного интеллекта.

Тестирование A / B[править]

Главная статья: тестирование A/B

В веб-разработке и маркетинге тестирование A/B или сплит-тестирование-это экспериментальный подход к веб-дизайну (особенно дизайн пользовательского опыта), целью которого является выявление изменений на веб-страницах, которые увеличивают или максимизируют результат интереса (например, скорость клика для баннерной рекламы). Как следует из названия, сравниваются две версии (A и B), которые идентичны, за исключением одного варианта, который может повлиять на поведение пользователя. Версия A может быть той, которая используется в настоящее время, в то время как версия B изменена в некотором отношении. Например, на веб-сайте электронной коммерции воронка покупок, как правило, является хорошим кандидатом для тестирования A/B, так как даже незначительные улучшения ставок высадки могут представлять значительный выигрыш в продажах. Значительные улучшения можно увидеть благодаря тестированию таких элементов, как текст, макеты, изображения и цвета.

Многомерное тестирование или тестирование ковша аналогично тестированию A / B, но одновременно тестирует более двух версий.

Количество испытуемых[править]

В начале 1990—х годов Якоб Нильсен, в то время исследователь Sun Microsystems , популяризировал концепцию использования многочисленных небольших тестов юзабилити—как правило , только с пятью испытуемыми каждый-на различных этапах процесса разработки. Его аргумент заключается в том, что, как только обнаруживается, что два или три человека полностью смущены домашней страницей, мало что получается, наблюдая за тем, как больше людей страдают от одного и того же ошибочного дизайна. "Сложные юзабилити-тесты-пустая трата ресурсов. Наилучшие результаты дает тестирование не более пяти пользователей и выполнение как можно большего количества небольших тестов."

Требование "пяти пользователей достаточно" было позже описано математической моделью , которая заявляет Для пропорции непокрытых проблем U

U = 1 − ( 1 − p ) n  U=1-(1-p)^{n

где p-вероятность того, что один субъект идентифицирует конкретную проблему и n-количество субъектов (или тестовых сессий). Эта модель отображается в виде асимптотического графа по отношению к числу реально существующих задач (см. рисунок ниже).

описание

В более поздних исследованиях утверждение Нильсена было с готовностью подвергнуто сомнению как эмпирическими доказательствами , так и более продвинутыми математическими моделями . две ключевые проблемы к этому утверждению:

  • Поскольку удобство использования связано с конкретным набором пользователей, такой небольшой размер выборки вряд ли будет репрезентативным для всего населения, поэтому данные из такой небольшой выборки с большей вероятностью будут отражать группу выборки, чем население, которое они могут представлять

( Не все проблемы юзабилити одинаково легко обнаружить. Неразрешимые проблемы замедляют общий процесс. В этих условиях процесс протекает гораздо медленнее, чем предсказывает формула Нильсена-Ландауэра.

Стоит отметить, что Nielsen не выступает за остановку после одного теста с пятью пользователями; его точка зрения заключается в том, что тестирование с пятью пользователями, исправление проблем, которые они раскрывают, а затем тестирование пересмотренного сайта с пятью разными пользователями-это лучшее использование ограниченных ресурсов, чем запуск одного теста юзабилити с 10 пользователями. На практике тесты проводятся один или два раза в неделю в течение всего цикла разработки с использованием от трех до пяти испытуемых в каждом раунде, а результаты доставляются разработчикам в течение 24 часов. Таким образом, число пользователей, фактически протестированных в ходе проекта, может легко достигать от 50 до 100 человек.

На ранней стадии, когда пользователи, скорее всего, немедленно столкнутся с проблемами, которые остановят их на своем пути, почти любой нормальный интеллект может быть использован в качестве испытуемого. На втором этапе тестировщики будут набирать испытуемых по широкому спектру способностей. Например, в одном исследовании опытные пользователи не обнаружили никаких проблем с использованием любого дизайна, от первого до последнего, в то время как наивный пользователь и самоидентифицированные опытные пользователи неоднократно терпели неудачу. позже, когда дизайн сглаживается, пользователи должны быть набраны из целевой популяции.

Когда метод применяется к достаточному количеству людей в течение проекта, возражения, поднятые выше, становятся адресованными: размер выборки перестает быть небольшим, и возникают проблемы с удобством использования, которые возникают только у случайных пользователей. Ценность метода заключается в том, что определенные проблемы проектирования, однажды возникшие, никогда больше не будут замечены, потому что они немедленно устранены, в то время как части, которые кажутся успешными, проверяются снова и снова. Хотя это правда, что первоначальные проблемы в дизайне могут быть протестированы только пятью пользователями, когда метод правильно применен, части дизайна, которые работали в этом первоначальном тесте, будут протестированы людьми 50 до 100.

Пример[править]

В 1982 году Apple Computer manual для разработчиков консультировала по юзабилити-тестированию:

  • "Выберите целевую аудиторию. Начните разработку человеческого интерфейса с определения целевой аудитории. Вы пишете для бизнесменов или для детей?"
  • Определите, сколько целевые пользователи знают о компьютерах Apple и предметах программного обеспечения.
  • Шаги 1 и 2 позволяют спроектировать пользовательский интерфейс в соответствии с потребностями целевой аудитории. Программное обеспечение для подготовки налогов, написанное для бухгалтеров, может предполагать, что его пользователи ничего не знают о компьютерах, но являются экспертами по Налоговому кодексу, в то время как такое программное обеспечение, написанное для потребителей, может предполагать, что его пользователи ничего не знают о налогах, но знакомы с основами компьютеров Apple.

Apple посоветовала разработчикам: "вы должны начать тестирование как можно скорее, используя призванных друзей, родственников и новых сотрудников":

  • Наш метод испытания следующим образом. Мы создали комнату с пятью-шестью компьютерными системами. Мы планируем две-три группы по пять-шесть пользователей одновременно, чтобы опробовать системы (часто без их ведома, что это программное обеспечение, а не система, которую мы тестируем). У нас в комнате двое дизайнеров. Меньше, и они пропускают много того, что происходит. Больше и потребители чувствуют как будто всегда кто-то дышит вниз их шеи.

Проектировщики должны наблюдать, как люди используют программу лично, потому что

  • Девяносто пять процентов камней преткновения найдены, наблюдая язык тела пользователей. Следите за щурящимися глазами, сгорбленными плечами, качающимися головами и глубокими вздохами. Когда пользователь попадает в корягу, он предполагает, что это "из-за того, что он не слишком яркий": он не будет сообщать об этом; он скроет его ... Не делайте предположений о том, почему пользователь запутался. Спросить его. Вы часто будете удивлены, узнав, что пользователь думал, что программа делает в то время, когда он заблудился.

Образование[править]

Юзабилити-тестирование было формальным предметом академического обучения по различным дисциплинам.

См. также[править]

Пруф[править]

.usability.gov/