當我們在回收問(wèn)卷時(shí),總會(huì )遇到與我們需要調研人群不匹配的用戶(hù),或者亂答的用戶(hù)。所以為了讓結果更準確,分析之前需要將這些“臟”樣本進(jìn)行清洗。
常見(jiàn)的“臟”樣本類(lèi)型:
(1)非目標樣本
(2)重復回答
(3)前后矛盾
(4)作答時(shí)間過(guò)長(cháng)或過(guò)短
數據清洗順序:
當我們的產(chǎn)品是針對60+的人群設計的,如果用戶(hù)的年齡不在這個(gè)范圍,可能就不具有參考價(jià)值。所以在設計問(wèn)卷時(shí),可以將非目標樣本直接設置為無(wú)效答卷。
【非目標樣本的無(wú)效問(wèn)卷】設置:設置完成后,一旦用戶(hù)的年齡不在60歲以上,系統會(huì )自動(dòng)將該樣本歸類(lèi)到“無(wú)效樣本”中。(設置方式請點(diǎn)擊此處查看)
用戶(hù)可能會(huì )重復回答一份問(wèn)卷,多份一樣的問(wèn)卷對于后續的分析沒(méi)有意義,所以在發(fā)放問(wèn)卷之前,可以設置【作答次數限制】,確保一個(gè)用戶(hù)只作答一次。
【作答次數限制】設置:可以根據需要,設置作答設備/IP地址/微信作答控制。(設置方式請點(diǎn)擊此處查看)
前后矛盾的作答情況有以下這些:
(1)內容矛盾:購買(mǎi)過(guò)XX品牌但不知道XX品牌。在問(wèn)卷編輯時(shí),可以通過(guò)【選項引用】,只給用戶(hù)展示需要勾選的選項。
【選項引用】設置:用戶(hù)在Q1選擇了品牌3、品牌4、品牌5,Q2的選項只會(huì )展示這三個(gè)品牌。
(2)人口屬性矛盾:年齡選擇18歲以下,但是駕齡選擇7-16年。這種可以在回收完問(wèn)卷后,通過(guò)篩選條件,批量將這些問(wèn)卷標記為無(wú)效問(wèn)卷。
【批量標為無(wú)效】設置:通過(guò)篩選條件(年齡時(shí)18歲以下,駕齡是0-6年/7-16年/16年以上)將符合條件的問(wèn)卷篩選出來(lái),然后批量將這些問(wèn)卷標為無(wú)效。
當用戶(hù)作答時(shí)間過(guò)長(cháng)或過(guò)短時(shí),可能都會(huì )造成數據的不準確。過(guò)長(cháng)說(shuō)明作答時(shí)可能有被干擾,數據質(zhì)量不好評估;過(guò)短說(shuō)明作答時(shí)可能不認真。
【作答時(shí)間過(guò)長(cháng)或過(guò)短】設置:可以通過(guò)快捷方式(小于2秒、大于10分鐘)、自己設置篩選條件——將作答時(shí)間過(guò)長(cháng)或過(guò)短的問(wèn)卷批量標為無(wú)效。