← 모든 문서
올바른 것을 만들기
실험실 없는 사용성 테스트: 초보자를 위한 가이드
FabricLoop 팀 작성 · 2026년 5월 · 4분 읽기
사용성 테스트는 비싸고 느리다는 불합리한 평판을 가지고 있습니다. "사용자 연구"라고 들으면, 사람들은 한쪽 거울, 클립보드를 가진 조정자, 2주 타임라인을 상상합니다. 그 테스트 버전은 존재하고 용도가 있지만 — 대부분의 제품 팀이 대부분의 경우에 필요로 하는 것은 아닙니다.
대부분의 팀이 필요로 하는 버전은 더 간단합니다: 5명의 사용자, Figma 프로토타입 또는 스테이징 환경, 비디오 콜, 세션당 45분. 제대로 하면, 배송 전에 심각한 사용성 문제의 대다수를 발견합니다. 일관되게 하면 — 스프린트당 한 번이라도 — 제품 품질에서 사후 출시 분석을 복제할 수 없는 복합적인 개선을 생성합니다.
처음부터 실행하는 방법은 다음과 같습니다.
"5명의 사용자는 사용성 문제의 85%를 찾을 것입니다. 나머지 15%는 배송하고 보면서 찾습니다. 완벽한 샘플 크기를 추구한다는 이유로 세션을 실행하는 것을 막지 마세요."
4단계 테스트 세션
사용성 테스트 세션 흐름
1
모집
대상 사용자와 일치하는 5명의 참가자를 찾습니다. 품질이 수량보다 낫습니다.
- 2-3개의 선별 기준 정의
- 먼저 기존 사용자에게 이메일 보내기
- 작은 인센티브 제공(기프트 카드)
- 24시간 전에 확인
2
스크립트
3-5개의 작업을 현실적인 시나리오로 작성, 지시사항이 아님.
- 목표를 명시하되 경로는 아님
- 맥락 포함("당신이 방금..."이라고 상상)
- 2개의 워밍업 질문 추가
- 먼저 팀원과 파일럿
3
실행
지도 없이 관찰합니다. 당신의 역할은 보고 듣는 것이지 도움을 주는 것이 아닙니다.
- 큰 소리로 생각하도록 요청
- 혼란스러운 사용자를 절대 구하지 마세요
- 오류뿐만 아니라 망설임도 기록
- 허락 하에 기록
4
종합
같은 날 디브리핑을 합니다. 관찰값을 인용문의 목록이 아닌 패턴으로 그룹화합니다.
- 2시간 이내에 디브리프
- 빈도별로 문제 그룹화
- 심각도 평가(중대/중간/경미)
- 한 페이지에서 발견사항 공유
1단계: 모집 — 몇 명이 테스트하는지보다 누가 테스트하는지가 더 중요합니다
5명의 참가자는 대부분의 사용성 테스트에 적합한 숫자입니다. Jakob Nielsen의 연구는 5명의 사용자가 사용성 문제의 약 85%를 발견하고 그 이후로는 수익이 감소한다는 것을 확립했습니다. 디자인 프로세스의 여러 지점에서 5명의 사용자의 3라운드는 15명의 1라운드보다 더 가치 있습니다.
모집 기준은 숫자보다 더 중요합니다. 대상 사용자와 밀접하게 일치하는 5명의 사용자의 사용성 테스트는 실제 문제를 노출시킵니다. 일치하지 않는 15명의 테스트는 잡음을 생성합니다. 2-3가지 선별 기준을 정의하세요 — 역할, 사용 맥락, 기술 편안함 수준 — 그리고 고수하세요.
대부분의 팀에 가장 빠른 모집 경로는 연락처 권한을 제공한 기존 사용자에게 이메일을 보내는 것입니다. 작은 인센티브를 제시하세요 — 45분 세션에는 £20 기프트 카드가 충분합니다. 모집과 테스트 사이의 시간이 길수록 노쇼율이 높아지므로 같은 주 내에 세션을 일정으로 잡으세요.
2단계: 스크립트 — 지시사항이 아닌 시나리오
가장 일반적인 스크립팅 실수는 작업을 지시사항으로 작성하는 것입니다: "설정을 클릭한 후 알림으로 이동하여 선택 사항을 ..."으로 변경합니다. 이것은 사용자에게 무엇을 할지 알려주며, 이는 지시 팔로우 여부를 테스트 중인 것을 의미합니다. 인터페이스가 직관적인지는 아닙니다.
대신 시나리오로 작업을 작성하세요: "너무 많은 알림을 받고 있고 누군가가 당신을 직접 언급할 때만 경고를 받고 싶다고 상상해 보세요. 당신은 무엇을 할까요?" 이것은 사용자에게 현실적인 목표를 주고 실제로 탐색하는 방식을 관찰하도록 하게 합니다 — 혼란의 지점 포함.
파일럿 세션 규칙
첫 번째 실제 참가자 전에 항상 팀원과 스크립트를 파일럿하세요. 명확해 보이는 스크립트는 큰 소리로 말할 때 일관되게 혼동을 생성합니다. 15분 파일럿은 어색한 표현, 모호한 작업, 타이밍 문제를 노출시킵니다 — 그리고 거의 아무것도 수정하는 데 드는 비용이 없습니다.
3단계: 실행 — 당신의 역할은 보기이지 도움이 아닙니다
사용성 테스트를 중재하는 가장 어려운 부분은 도움을 주고 싶은 충동에 저항하는 것입니다. 사용자가 혼란스러워하면, 모든 본능이 뛰어들어 어디를 클릭할지 보여주라고 말합니다. 하지만 혼동은 데이터입니다. 어려움을 겪고 있는 사용자는 인터페이스에 문제가 있다는 것을 알려주고 있습니다 — 그리고 개입하는 순간, 신호를 잃습니다.
전체 세션에서 사용자에게 큰 소리로 생각하도록 요청하세요: "진행하면서 무엇을 보고 있고 무엇을 생각하고 있는지 계속 말해 주세요." 이것은 정신 모델에 대한 연속적인 데이터 흐름을 생성합니다. 오류뿐만 아니라 망설임도 기록하세요 — 올바른 버튼을 클릭하기 전에 3초를 멈춘 사용자는 여전히 디자인 문제를 노출시키고, 그들이 결국 성공했더라도 말입니다.
격려 함정
"당신은 잘하고 있습니다"는 사용성 테스트에서 절대 말해야 할 거짓말입니다. 잘하고 있다고 느끼는 참가자는 혼동 보고를 중단합니다. 중립적으로 유지하세요: "감사합니다, 계속해 주세요." 노력을 인정하되, 성과는 인정하지 마세요.
4단계: 종합 — 인용문이 아닌 패턴
종합 단계는 대부분의 가치가 만들어지는 곳입니다 — 그리고 대부분의 팀이 모서리를 자르는 곳입니다. 5개 세션의 원본 메모는 발견사항이 아닙니다. 팀으로 디브리프하고, 주제별로 관찰을 그룹화하고, 심각도 등급을 할당할 때 발견사항이 됩니다.
세션과 같은 날에 디브리프하세요. 관찰이 신선합니다. 문제를 3가지 버킷으로 그룹화하세요: 심각함(사용자가 작업을 완료할 수 없음), 중간(사용자가 상당한 어려움이나 오류로 작업을 완료), 경미함(완료를 방지하지 않은 마찰). 심각한 문제는 배포 전에 수정되어야 합니다. 중간 문제는 다음 스프린트에서 우선순위가 매겨져야 합니다. 경미한 문제는 백로그에 들어갑니다.
한 페이지에 발견사항을 작성하세요: 상위 3개의 심각한 문제, 최소 2명의 참가자로부터의 증거, 각각에 대해 제안된 디자인 변경. 더 많은 공간이 필요한 것은 별도 문서에 속합니다.
FabricLoop이 사용성 테스트를 어떻게 지원하는지
세션 메모, 녹음, 종합, 디자인 결정이 한곳에 속합니다. FabricLoop 스레드를 통해 각 세션의 원본 메모를 첨부하고, 더 넓은 팀과 종합을 공유하고, 뒤따른 디자인 변경과 직접 연결할 수 있습니다 — 따라서 미래 팀원들은 무엇이 변했는지뿐 아니라 왜 변했는지 볼 수 있습니다.
이 기사에서 배울 10가지
- 사용성 테스트는 실험실, 예산 또는 전문가가 필요하지 않습니다. 5명의 사용자, 프로토타입, 비디오 콜로 대부분의 심각한 문제를 발견합니다.
- 5명의 참가자는 사용성 문제의 약 85%를 발견합니다. 15명 중 15명은 다른 지점의 5명 3라운드보다 더 가치가 있습니다.
- 수량보다 품질로 모집하세요. 대상 페르소나와 일치하는 5명은 실제 문제를 노출시킵니다; 일치하지 않는 15명은 잡음을 생성합니다.
- 지시사항이 아닌 시나리오로 작업을 작성하세요("..."하려고 상상해 보세요). 지시사항은 방향 팔로우를 테스트하지, 사용성을 테스트하지 않습니다.
- 첫 실제 세션 전에 항상 팀원과 스크립트를 파일럿하세요. 명확해 보이는 스크립트는 큰 소리로 자주 혼동을 생성합니다.
- 세션 중 당신의 역할은 보기입니다, 도움이 아닙니다. 사용자 혼동은 데이터입니다 — 개입하면 신호가 제거됩니다.
- 참가자에게 전체 세션을 통해 큰 소리로 생각하도록 요청하세요. 오류뿐만 아니라 망설임도 기록하세요 — 올바른 클릭 전의 긴 일시 중지도 여전히 디자인 문제입니다.
- 참가자에게 그들이 잘하고 있다고 절대 말하지 마세요. 격려는 혼동 보고를 억압합니다. 중립적으로 유지하세요.
- 세션과 같은 날에 디브리프하세요, 관찰이 신선합니다. 심각도별로 문제를 그룹화합니다: 심각, 중간, 경미.
- 한 페이지에 발견사항을 작성하세요: 상위 3개의 심각한 문제, 최소 2명의 참가자로부터의 증거, 각각에 대해 제안된 수정.