Custom Search

Oct 14, 2009

ประเมินผลงานด้วยโพลนั้นเชื่อถือไม่ได้

วรากรณ์ สามโกเศศ
มติชน
วันที่ 15 ตุลาคม พ.ศ. 2552



การ ที่โพลระบุว่าประชาชน
ประเมินผลงานนายกรัฐมนตรี
หรือรัฐมนตรีคนใดว่าได้คะแนน 4 จาก 10 นั้น
ถ้าพิจารณาให้ดีแล้วมันแทบไม่มีความหมายอะไรเลย
เช่นเดียวกับผลจากโพลในเรื่องอื่นๆ ในบางครั้ง
โพลนั้นจะมีประโยชน์ก็ต่อเมื่อผู้ทำโพลถามคำถาม
และจัดให้มีการประเมินอย่าง มีความหมายและประชาชน
ผู้รับสารเข้าใจข้อจำกัดของผลจากโพลเหล่านั้นเท่านั้น

ใน เบื้องต้นถ้ากลุ่มที่ถูกสำรวจไม่ได้เป็น
ตัวแทนของประชาชนทั้งหมดดังที่โพลคาดหวัง

ผลก็ผิดพลาดแต่แรก อุปมาถ้าน้ำแกงในช้อน
ที่ตักมามิได้เป็นตัวแทนของหม้อแกงทั้งหม้อ
รสชาติของแกงในช้อนก็ไม่ได้มีความหมายอะไรเลย

การคัดกลุ่มตัวอย่าง ของการสำรวจก่อนทำโพล
จึงเป็นเรื่องสำคัญยิ่ง
ถ้าต้องการรู้ว่าคนไทยทั้งประเทศรู้สึกอย่างไร
กลุ่มตัวอย่างก็ต้องเป็นตัวแทนของประชาชนทั้งประเทศ
กล่าวคือองค์ประกอบของกลุ่มตัวอย่าง

ต้องเหมือนองค์ประกอบของคนไทยทั้งประเทศ

การ เอาแบบสอบถามออกไปถามกลุ่มตัวอย่าง
ที่มีลักษณะดังต้องการไว้ก็ต้องกระทำด้วย
ความระมัดระวังอย่างยิ่ง ประเด็นสำคัญก็คือ
"การนั่งเทียน" ของผู้ถาม ถ้าไม่ควบคุมให้ดี
ผู้ถามก็จะตอบเสียเอง เพราะขี้เกียจออกไปเดินท่อมๆ
ตากแดดตามหาสมาชิกกลุ่มตัวอย่าง

ที่มีลักษณะตามที่ปรารถนาเพื่อให้ตอบคำถาม

ถึง แม้จะพยายามใช้วิธีคัดกรองทางวิชาการ
เพื่อให้ได้ข้อมูลที่ไม่ได้มาจากการ "นั่งเทียน" เพียงใด
ก็ไม่อาจหลีกหนี "พลังเทียนไข" ไปได้ทั้งหมด
หากแบบสอบถามมิได้ออกแบบเพื่อให้
สามารถตรวจสอบการ "นั่งเทียน"
ได้อย่างมีประสิทธิภาพพอควรแล้ว

ผลก็จะยิ่งไม่มีความน่าเชื่อถือ

ถ้าให้ผู้ออกคำถามความเห็นสามารถเอา
แบบสอบถามกลับบ้านข้ามคืนได้แล้ว
พลัง "เทียนไข"ก็จะสูงยิ่งขึ้น ปัจจุบันมีการถามความเห็น
ทางโทรศัพท์จากกลุ่มตัวอย่างที่ได้คัดสรรไว้แล้ว
ดังนั้น "พลังเทียนไข"ก็น้อยลงไปแต่ก็ไม่หมด
เพราะสมาชิกที่ไม่รับผิดชอบอาจให้คนอื่น

ตอบคำถามแทนหรือตอบอย่างพอไปที่
เพราะได้รับผลตอบแทนแล้วจากการเป็นกลุ่มตัวอย่าง

สมมุติว่าได้กวน หม้อแกงเป็นอย่างดีและตักออกมาหนึ่งช้อน
โดยแน่ใจว่าเป็นตัวอย่างน้ำแกงในหม้อแกง
ปัญหาก็ยังไม่จบ คำถามและลักษณะ
การให้คำตอบของโพลเป็นสิ่งสำคัญอย่างยิ่ง

การให้ ประชาชนประเมินผลงานโดยให้สเกล 1 ถึง 10
และเมื่อได้ผลมาแล้วก็เอามาเฉลี่ยและดูว่าเกิน 5
ซึ่งหมายถึงว่า "สอบได้" หรือไม่ นั้นเป็นเรื่องที่ผิดพลาด
เพราะประการแรกผู้ตอบแต่ละคนมีมาตรฐาน
ของการประเมินไม่เหมือนกัน
บางคนเข้มงวดมากถึงจะทำงานดีก็ให้เพียง 3
บางคนถึงทำงานแย่ก็ให้ 4 ฯลฯ
เมื่อมีเกณฑ์ "ผ่าน" ที่แตกต่างกัน
ดังนั้น การเอามาบวกกันและ
หารเฉลี่ยและเอา 5 เป็นเกณฑ์ผ่าน
จึงไม่มีความหมาย


ประการ ที่สอง เมื่อสเกลคะแนนกว้างเช่นนี้
การให้คะแนนจึงสะเปะสะปะเพราะไม่อาจ
ตอบได้ว่า 9 คะแนนกับ 7 คะแนนหรือ 6 กับ 8
ซึ่งต่างกันถึง 2 คะแนน นั้นมีเหตุผลมาจากอะไร

ประการที่สาม แต่ละคนให้ความสำคัญแก่คะแนน
แต่ละระดับไม่เท่ากัน สำหรับบางคนพอใจเต็มที่ให้ 10 คะแนน
บางคนถึงเต็มใจเต็มที่อย่างดีก็ให้แค่ 7
บางคนไม่พอใจก็ให้ 4 คะแนน

บางคนไม่พอใจก็ให้ 0 คะแนน ฯลฯ

ในความ เห็นผู้เขียน
ถ้าจะช่วยให้การประเมินเช่นนี้มีความหมาย
น่าจะมีสเกลที่ให้เพียง 1 ถึง 5
และมีคำอธิบายกำกับว่าแต่ละระดับคะแนนที่ให้
มีความหมายอย่างไร เช่น ระบุว่าการให้ 3 เท่ากับพอใจปานกลาง
ส่วน 4 คะแนนนั้นหมายถึงสูงกว่าพอใจปานกลาง
แต่ยังไม่พอใจที่สุด ส่วน 5 นั้นพอใจสูงสุด
ในด้านคะแนนน้อยก็ให้คำอธิบายว่า 2
คือ ต่ำกว่าพอใจปานกลางแต่ยังไม่ถึงไม่พอใจสูงสุด

ส่วน 1 นั้นคือ ไม่พอใจที่สุด

การ ให้ประเมินโดยสเกลเช่นนี้
จะเป็นการบังคับให้ประเมินอย่างชนิด
ที่แก้ไขปัญหา 3 ข้อข้างต้นได้
และสามารถพอจะเอามาเฉลี่ยกันและมีความหมายได้
สมมุตินายกรัฐมนตรีได้คะแนนความพอใจออกมา 3.5
ก็หมายถึงว่าโดยเฉลี่ยกลุ่มตัวอย่างซึ่งเป็นตัวแทนของประชาชนไทย
มีความพอใจการทำงานสูงกว่าปานกลาง
แต่ไม่ถึงระดับพอใจมากที่เป็นระดับ 4


ใน การตีความโพลต้องทำให้ประชาชนเข้าใจว่า "3.5"
นี้คือคะแนนเฉลี่ย ซึ่งหมายถึงว่ามีคนจำนวนหนึ่ง
ที่ประเมินให้คะแนนสูงกว่า 3.5 และจำนวนหนึ่งที่
ประเมินให้คะแนนต่ำกว่า 3.5
(เปรียบเสมือนในห้องหนึ่งคนมีความสูงเฉลี่ย 1.65 เมตร
มิได้หมายความว่าจะมีคนสูง 1.65 เมตรอยู่ในห้องนั้นหลายคน
อาจไม่มีคนสูง 1.65 เมตรสักคนอยู่เลยก็ได้
จำนวนหนึ่งอาจเป็นปิ๊กมี่ (Pigmy) จากนิวกินี
ซึ่งสูงเพียง 1 เมตรหรือ 1 เมตรกว่า
และอีกจำนวนหนึ่งอาจเป็นคนเผ่ามาไซ

(Maasai จากแอฟริกา) ซึ่งสูง 2 เมตรกับ 2 เมตรกว่า
ตัวเลข 1.65 เมตรมาจากความสูงเฉลี่ยของคนทั้งหมดในห้อง)

ถ้าจะให้โพลมีความหมาย มากกว่านี้ ต้องบอกด้วยว่า
ความพอใจการทำงานของนายกรัฐมนตรีมีลักษณะคะแนนอย่างไร
มีร้อยละเท่าใดที่ประเมินให้คะแนน 5 4 หรือ 2 หรือ 1
มิใช่การให้คะแนนประเมิน 3 หรือ 4 หรือ 5
จากคะแนนเต็ม 10 ซึ่งแทบจะไม่มีความหมายเอาเลย
เมื่อคำนึงถึงว่าคะแนนเหล่านี้มาจากคนที่รู้เรื่องต่างๆ ไม่เท่ากัน
แต่นับเป็นหนึ่งเท่ากันในกลุ่มตัวอย่างแล้วยิ่งรู้ว่าโพลมีข้อจำกัด


การ ประเมินความพอใจผ่านการสำรวจในต่างประเทศ
เท่าที่เคยเห็นก็ไม่มีการให้คะแนนเต็ม 10
(เห็นมีแต่มวยสากลที่ให้แต่ละยก ซึ่งโดยประเพณี
ก็มีการให้กันแค่ 10 หรือ 9 คือถ้าใครชนะยกนั้นก็ได้ 10
หากอีกคนแพ้ก็จะได้ 9 และถ้าแพ้ยับเยินก็จะได้ 8 คะแนน
กรณีนี้ผู้ให้คะแนนมีเกณฑ์การให้แต่ละคะแนนที่ชัดเจน
การใช้คะแนนเต็ม 10 หรือ 3 จึงไม่แตกต่างกัน)


สิ่งที่รู้สึกขบขันและไม่เคยเข้าใจก็คือมี ผู้ส่ง SMS
โหวตลงคะแนนโดยยอมเสียเงิน 3 บาท หรือมากกว่านั้นกัน
ในการตัดสินการแข่งขันร้องเพลง AF (ซึ่งก็คือโพลอย่างยิ่ง)
การใช้คะแนนโหวตแบบนี้เพื่อวัดความนิยม
โดยคนดูที่บ้านนั้นผิดหลักสถิติของ การตัดสินความนิยม
ผู้แข่งขันคนใดที่มีผู้สนับสนุน
ที่มีเงินมากก็ได้คะแนนมากอย่างบิดเบี้ยวไป

จากความเป็นจริงของความนิยม
ที่ขบขันก็คือไม่มีทางรู้ว่าโหวตที่ตนเองยอมเสียเงินค่า SMS นั้น
ได้รับการนับเข้าไปหรือเปล่า
เพราะไม่เคยมีการประกาศคะแนนโหวตให้รู้ ทุกอย่างลึกลับ
ไม่โปร่งใสและไม่เป็นธรรมแก่ผู้บริโภค
(คนดูเสียเวลาและค่าไฟฟ้าดูและมีคนเสียเงินส่ง SMS
แต่ไม่รู้ว่าผลการโหวตจริงเป็นเช่นใด)


ความเห็นจากโพลมักถือกันว่า คือ public opinion
(ความเห็นของสาธารณชนหรือบางคนไปไกล
ถึงกับบอกว่าเป็นมติมหาชน)
แต่เนื่องด้วยสารพัดข้อจำกัดของโพล
จริงๆ แล้วมันจึงไม่มี public opinion ที่แท้จริง

จะมีก็แต่เพียง opinion in public

หรือความเห็นที่ปรากฏให้เห็นในสาธารณะเท่านั้น

หน้า 6