การวิเคราะห์ข้อสอบ Item Analysis คืออะไร มีอะไรบ้าง?
การ วิเคราะห์ข้อสอบ คือการตรวจสอบคุณภาพของข้อสอบเป็นรายข้อ เพื่อพิจารณาว่าข้อสอบแต่ละข้อนั้น มีระดับความยากหรือค่าความง่าย (Difficulty index or Easiness) และค่าอำนาจจำแนกของข้อสอบ ( Disciminant index ) เพียงใด รวมทั้งพิจารณาถึงประสิทธิภาพของตัวลวงในข้อเลือกตอบของข้อสอบข้อนั้นด้วย ผลการวิเคราะห์จะทำให้ทราบว่าข้อสอบแต่ละข้อมีความเหมาะสมมากน้อยเพียงใด ข้อสอบที่มีคุณภาพจะสามารถนำไปวัดและประเมินผลได้อย่างเที่ยงตรงและเชื่อมั่นได้
ข้อสอบที่จะวิคราะห์คุณภาพรายข้อ ลักษณะข้อสอบจะเป็นแบบเลือกตอบ แบบถูก-ผิดหรือแบบเติมคำสั้น ๆ ก็ได้ แต่ต้องมีรูปแบบเดียวกันทั้งฉบับ ซึ่งมีวิธีวิเคราะห์ 2 แบบ คือ
การวิเคราะห์ข้อสอบแบบเลือกตอบแบบอิงกลุ่ม
เป็นการวิเคราะห์ข้อสอบที่ใช้ผลการสอบไปประเมินแบบอิงกลุ่มโดยนำความแตกต่างระหว่างบุคคลมาเป็นแนวคิดในการประเมินผล การวิเคราะห์ ข้อสอบแบบอิงกลุ่มนี้ จึงเป็นการวิคราะห์โดยนำผลคะแนนของผู้เรียนแต่ละคนไปเปรียบเทียบกับผลคะแนนของผู้เรียนดนอื่น ๆ ในกลุ่มเดียวกัน เพื่อจำแนกคนที่เรียนเก่งออกจากคนที่เรียนอ่อนดัชนีบ่งชี้คุณภาพของข้อสอบสำหรับแบบสอบอิงกลุ่ม ได้แก่ ระดับความยากง่าย ( p ) และอำนาจจำแนก ( r ) ซึ่งข้อสอบที่ดีนั้น นอกจากจะต้องมีระดับความยากง่ายพอเหมาะแล้วจะต้องมีอำนาจการจำแนกที่ดีด้วย
ระดับความยากง่าย (P)
ระดับความยากง่ายของข้อสอบ หมายถึง สัดส่วนของจำนวนผู้ที่ตอบข้อสอบได้ถูกต้องต่อจำนวนผู้ที่ตอบข้อสอบทั้งหมด หรือหมายถึงจำนวนร้อยละของผู้ตอบข้อสอบนั้น ๆ ถูก ตัวอย่างเช่น ค่า p = 0.30 แสดงว่า จำนวนผู้ตอบ 100 คน มีผู้ที่ตอบข้อนั้น ๆ ถูก 30 คน ค่าความยากง่ายจะมีค่าระหว่าง 0 ถึง 1.00 ในการพิจารณาค่ความยากง่ายนั้น
ถ้าข้อสอบมีค่ความยากง่ายสูง เช่น p = 0.95 แสดงว่า มีผู้ตอบถูกจำนวนมาก จึงถือว่าเป็นข้อสอบที่ง่าย แต่ในทางกลับกัน ถ้าข้อสอบมีผู้ตอบถูกน้อย เช่น p = 0.15 แสดงว่า เป็นข้อสอบที่ยาก
ข้อสอบที่ดีจะมีระดับความยากง่าย เท่ากับ 0.5 ซึ่งจะทำให้เกิดค่าอำนาจการจำแนกสูงสุดและมีความเที่ยงสูง อย่างไรก็ตามในการสอบวัดความรู้ผลการเรียนโดยทั่วไป มักนิยมให้มีข้อสอบที่มีระดับความยากง่ายในระดับต่าง ๆ ปะปนกันไปโดยจัดให้มีข้อสอบมีค่าความยากง่ายพอเหมาะ ( p มีคำใกล้เคียง 0.5 ) เป็นส่วนใหญ่ รวมทั้งให้มีข้อสอบที่ค่อนข้างยากและต่อนข้างง่ายอีกจำนวนหนึ่ง แต่ถ้าเป็นการสอบแข่งขันเพื่อคัดเลือกผู้ที่มีความรู้ความสามารถควรมีสัดส่วนของข้อสอบที่ยากสูงขึ้น ทั้งนี้ ข้อสอบที่ดีควรมีค่าความยากง่าย (p) ระหว่าง 0.20 – 0.80 ในข้อสอบประเภท 4 ตัวเลือก ส่วนข้อสอบประเภทถูก – ผิด ค่าความยากง่าย ควรอยู่ระหว่าง 0.60 – 0.95 (Nunnally, 1967. อ้างถึงใน เยาวดี รางชัยกุล วิบูลย์ศรี, 2552 , หน้า 144 – 145 ) เกณฑ์การแปลความหมายค่าความยากง่าย ( P ) ของข้อสอบ ( ล้วน สายยศ และอังคณา สายยศ, 2543, หน้า 185 )
อำนาจจำแนก ( r )
อำนาจจำแนก หมายถึง ความสามารถของข้อสอบในการจำแนกหรือแยกให้เห็นความแตกต่างระหว่างผู้สอบที่มีผลสัมฤทธิ์ต่างกัน เพื่อที่จะใช้พยากรณ์หรือบ่งชี้ความแตกต่าง ที่เห็นชัดในด้านความสามารถ เช่นจำแนกคนเก่งกับคนอ่อนจากกันได้โดยถือว่าคนเก่งควรทำข้อสอบข้อนั้นได้ส่วนผู้ที่อ่อนไม่ควรทำข้งสอบข้อนั้นได้อำนาจจำแนกของข้อสอบ จะมีค่าตั้งแต่ – 1 ถึง + 1 ค่าอำนาจจำแนกที่ดี ควรมีค่าตั้งแต่ 0.2 ขึ้นไป
กรณีที่ค่า r ติดลบ แสดงว่า ข้อสอบข้อนั้นจำแนกกลับ คนเก่งทำไม่ได้ แต่คนอ่อน ทำได้ ถือว่าเป็นข้อสอบที่ไม่ดีควรตัดทิ้ง นอกจากนี้ อาจารย์ผู้สอนควรตรวจสอบการจัดการเรียนสอนของตน ว่เพราะเหตุใดผู้ที่เรียนเก่งจึงไม่เข้าใจในเรื่องที่สอน
เกณฑ์การแปลความหมายค่าอำนาจจำแนก ( r ) ของข้อสอบ
ประสิทธิภาพของตัวลวง
1. สัดส่วนของผู้ที่เลือกตัวลวง ( P ) หมายถึง สัดส่วนของจำนวนคนที่เลือกตัวลวง นั้น ๆ เช่น ข้อสอบข้อหนึ่งมีคนสอบ 100 คนมีคนเลือกตัวลวง ก. 25 คน แสดงว่า สัดส่วน ผู้เลือกตัวลวง ก. = 0.25 หรือ 25%
2. อำนาจจำแนกของตัวลวง ( r ) หมายถึง ผลต่างระหว่างสัดส่วนของคนในกลุ่มอ่อนที่เลือกตัวลวงกับสัดส่วนของคนในกลุ่มเก่งที่เลือกตัวลวงนั้น ๆ
การเลือกข้อสอบจากผลการวิเคราะห์ ข้อสอบ
เมื่อวิเคราะห์ข้อสอบได้ค่าความยากง่ายและอำนาจการจำแนกแล้ว ควรนำกราฟ ซึ่งจะแสดงการกระจายของข้อสอบและชี้ให้เห็นว่า ข้อสอบข้อใดบ้างที่อยู่ในเกณฑ์ใช้ได้หรือใช้ไม่ได้
ตัวอย่าง : กราฟแสดงการกระจายของข้อสอบตามผลการ วิเคราะห์ ข้อสอบระดับความยาก ( p)
การวิเคราะห์ข้อสอบแบบเลือกตอบแบบอิงเกณฑ์
การวิเคราะห์ ข้อสอบแบบอิงเกณฑ์ มีจุดมุ่งหมายเพื่อดูว่าผู้เรียนมีความรู้ ความสามารถอะไรบ้าง หรือผลที่เกิดจากการเรียนการสอนตามเกณฑ์หรือมาตรฐานที่ตั้งไว้เพียงใด มากกว่าที่จะเปรียบเทียบกับกลุ่มว่าใครเก่งกว่าใคร เนื่องจากการวิเคราะห์ ข้อสอบแบบอิงเกณฑ์เกี่ยวข้องกับประสิทธิภาพในการวัดผลของการจัดการเรียนการสอนโดยตรง ถ้าหากอาจารย์ใช้ข้อสอบชุดเดียวกันทดสอบก่อนเรียน ( Pre – Test ) และหลังเรียน ( Post – Test ) ข้อสอบอิงเกณฑ์ที่มีประสิทธิภาพ ควรตั้งอยู่บนสมมติฐานที่ว่า กระบวนการเรียนการสอนจะส่งผลโดยตรงต่อการเรียนรู้ของผู้เรียน เมื่อการเรียนการสอนสิ้นสุดลง ควรมีผู้ตอบถูกมากกว่าก่อนเรียน จึงเกิดแนวคิดของคัชนีความไวของผลการเรียนการสอนเกิดขึ้นดัชนีบ่งชี้คุณภาพของข้อสอบสำหรับแบบสอบอิงเกณฑ์ ได้แก่ ความสอดคล้องระหว่างข้อสอบกับจุดมุ่งหมาย ( Item – Objective Congruence : IOC ) ความยากของข้อสอบ (Item Difficulty : P,) และอำนาจจำแนกหรือดัชนีความไว ( Sensitivity Index : S,)
ความสอดคล้องระหว่างข้อสอบกับจุดมุ่งหมาย ( IOC ) หมายถึง ลักษณะของข้อสอบที่เป็นตัวแทนของจุดมุ่งหมายการเรียนรู้ที่กำหนดไว้วิการวัคความสอดคล้องสามารถทำได้โดยอาศัยการตัดสินของผู้ทรงคุณวุฒิ ไม่ต่ำกว่า 3 คน เป็นผู้พิจารณา เช่น ให้ผู้ทรงคุณวุฒิประเมินค่าความสอดคล้องของข้อสอบแต่ละข้อกับจุดมุ่งหมายการเรียนรู้ที่มุ่งวัดโดยใช้มาตราส่วนแบบประเมินค่าระดับ ( Likert Scale ) แล้วนำมาคำนวณหาค่าเฉลี่ยถ้าค่าเฉลี่ย (x̄) ≥ 4.00 จะถือว่าสอดคล้อง หรือถ้าใช้แบบประเมินค่า 3 ระดับ จะถือว่าข้อสอบนั้นสอดคล้องกับ จุดมุ่งหมายเมื่อ x̄) ≥ 80%
ความยากของข้อสอบ ( Item Dificulty : P ) หมายถึง สัดส่วนของผู้ตอบข้อสอบข้อนั้น ๆ ได้ถูกต้อง โดยพิจารณาจากกลุ่มที่ได้เรียนเรื่องนั้นมาแล้ว กับกลุ่มที่ไม่ได้เรียนเรื่องนั้น ข้อสอบที่ง่ายสำหรับกลุ่มที่เคยเรียน สามารถเป็นข้อสอบอิงเกณฑ์ที่ดีได้ เพราะอาจารย์ผู้สอนสามารถจัดการเรียนการสอนให้ผู้เรียนส่วนใหญ่เกิดการเรียนรู้และทำข้อสอบได้หรืออาจเป็นเพราะข้อสอบง่ายเกินไป จึงทำให้ผู้เรียนตอบถูกจากความรู้เดิมโดยไม่ได้เรียนรู้เพิ่มเติม ค่า P, จะอยู่ระหว่าง 0 ถึง 1
ดังนั้น การวิเคราะห์ข้อสอบอิงเกณฑ์ จึงจำเป็นต้องตรวจสอบว่า ก่อนเรียนมีสัดส่วนของคำตอบถูกมากน้อยเพียงใดเพื่อนำผลมาเปรียบเทียบกันตอนหลังเรียน
การวิเคราะห์ข้อสอบแบบอิงเกณฑ์จะพิจารณาค่าความยากของข้อสอบแตกต่างจากแบบอิงกลุ่ม เนื่องจากไม่ได้เน้นที่จะนำค่าความยากง่ายมาเพื่อเลือกข้อสอบ แต่จะเน้นที่คุณภาพในการสอน กล่าวคือ ถ้าอาจารยังไม่ได้สอนเนื้อหานั้น ข้อสอบควรจะยาก คือ มีค่า P, ต่ำ แต่ถ้าได้สอนแล้วและสอนอย่างมีประสิทธิภาพส่งผลให้ผู้เรียนเกิดการเรียนรู้ ข้อสอบควรจะง่าย คือมีค่า P, สูง
ลักษณะข้อสอบอิงเกณฑ์ที่ดี ควรมีค่าความยากของข้อสอบ ดังนี้ ( ศิริชัย กาณจนวาสี,2552 หน้า 243 )
2.3 อำนาจจำแนกหรือดัชนีความไว ( Sensitivity Index : S,) หมายถึง ผลต่างระหว่างสัดส่วนของผู้ที่ตอบถูกหลังเรียน กับสัดส่วนผู้ที่ตอบถูกก่อนเรียน
S มีค่าระหว่าง -1 ถึง 1 ค่า S ควรมีค่าเป็นบวก ยิ่งเข้าใกล้ 1 ยิ่งมีความไว ซึ่งแสดงว่าข้อสอบข้อนั้นสามารถจำแนกผู้รอบรู้จากผู้ไม่รอบรู้ได้ดี และสามารถจำแนกการสอนได้อย่างมีประสิทธิภาพ ดังนั้น อำนาจจำแนกหรือดัชนีความไวของข้อสอบ ( S) ควรมีค่า > 0
ลักษณะข้อสอบอิงเกณฑ์ที่สามารถจำแนกการสอนได้อย่างมีประสิทธิภาพ ควรมีค่า S ดังนี้ (พิชิต ฤทธิ์จรูญ, 2552, หน้า 145 )
ซึ่งค่า S นี้ จะแตกต่างจากค่าอำนาจจำแนก ( r ) ของข้อสอบแบบอิงกลุ่ม คือ ค่าอำนาจจำแนก ( r )ของข้อสอบแบบอิงกลุ่ม เป็นดัชนีที่ชี้ให้เห็นว่า สามารถจำแนกคนที่มีผลสัมฤทธิ์ทางการเรียนสูงและต่ำได้มากน้อยเพียงใด
ข้อจำกัดของดัชนีความไว
1. ต้องสอบ 2 ครั้ง คือ ก่อนเรียนและหลังเรียน จึงจะคำนวณค่าได้
2. S ที่มีค่าต่ำหรือมีค่าเป็นลบ อาจเป็นผลจากข้อสอบหรือการจัดการเรียนการสอนไม่มีประสิทธิภาพ
3. กรณีที่มีระยะห่างระหว่างการสอบครั้งแรกและครั้งที่ 2 ใกล้กัน ตอบหรือคะแนนครั้งหลังอาจได้รับอิทธิพลจากการสอบครั้งแรกได้ประสิทธิภาพของตัวลวง เมื่อสร้างข้อสอบอิงเกณฑ์แบบหลายคัวเลือก ( Multiple Choices ) ผู้ที่เลือกตัวลวง ถือว่า ตอบผิด ซึ่งแสดงให้เห็นว่า ผู้นั้นยังไม่สัมฤทธิ์ผลตามเป้าหมายของการวัด ในการวิเคราะห์ประสิทธิภาพตัวลวงทำโคยการตรวจสอบความถี่ของผู้ที่เลือกตัวลวงนั้น ๆ และควรดูจากผลการสอบก่อนเรียน ( Pre – Test ) ถ้าตัวลวงใคมีผู้เลือกในสัดส่วนที่สูง ถือว่าเป็นตัวลวงที่ใช้ได้ แต่ถ้าตัวลวงใดมีผู้เลือกน้อย แสดงว่าตัวลวงนั้นขาดประสิทธิภาพ สมควรที่จะต้องมีการปรับปรุงแก้ไขให้ดีขึ้น ( ศิริชัย กาญจนวาสี , 2552 หน้า 241 ) และตัวลวงที่จัดว่าเป็นตัวลวงที่ดีนั้น ผู้ที่เรียนอ่อนควรจะเลือกตอบมากกว่าผู้ที่มีผลการเรียนดี
ประโยชน์ของการวิเคราะห์ข้อสอบ
1. ทำให้ทราบข้อมูลพื้นฐานของตัวข้อสอบและคำตอบรวมถึงข้อสอบแต่ละข้อได้ทำหน้าที่วัดผลสัมฤทธิ์อย่างมีคุณภาพเพียงใด
2. ชี้ให้เห็นถึงจุดอ่อนที่ผู้สอนหรือผู้เรียนต้องปรับปรุงแก้ไข เพื่อพัฒนาความสามารถและทักษะของผู้เรียนให้เป็นตามที่คาดหวัง
3. เป็นพื้นฐานสำคัญในการปรับปรุงพัฒนาการเรียนการสอน โดยเฉพาะอย่างยิ่งด้านพฤติกรรมการเรียนรู้ที่หมาะสมสำหรับเนื้อหาวิชานั้น ๆ ช่วยเพิ่มทักษะในการสร้างข้อสอบ ทำให้ทราบถึงอำนาจการจำแนก ระดับความยากง่าย ประสิทธิภาพของตัวลวง ตลอดจนการเขียนข้อสอบในลักษณะใดจึงจะได้ข้อสอบที่ดี
5. ทำให้สามารถคัดเลือกข้อสอบที่มีคุณภาพมารวมเป็นฉบับข้อสอบที่ดี สามารถจัดทำข้อสอบคู่ขนานและเป็นรากฐานสำคัญในการพัฒนาแบบสอบมาตรฐาน
บทสรุป
ข้อสอบที่ดี ควรมีค่าความยากง่ายที่เหมาะสมและมีอำนาจจำแนกสูง ค่าเฉลี่ยความยากง่ายของข้อสอบทั้งฉบับ ควรมีค่าประมาณ 0.50 แต่อย่างไรก็ตามในการคัดเลือกข้อสอบจะต้องคำนึงถึงความสมดุลระหว่างข้อสอบที่มีสถิติเหมาะสมกับข้อสอบที่วัดครอบคลุมจุดประสงค์ และเนื้อหาที่ต้องการด้วย บางครั้งอาจมีความจำเป็นที่จะต้องใช้ข้อสอบที่มีอำนาจการจำแนกไม่สูงนักเพื่อให้มีข้อสอบที่วัดครอบคลุมเนื้อหาที่ต้องการ
1. การวิเคราะห์ข้อสอบแบบเลือกตอบแบบอิงกลุ่ม
– ระดับความยากง่าย ( p ) ถ้าค่า p ยิ่งมากข้อสอบข้อนั้นจะง่ายและค่า p ยิ่งน้อย ข้อสอบนั้นจะยาก ทั้งนี้ข้อสอบที่ดีควรมีค่า p ระหว่าง 0.20 – 0.80
– อำนาจการจำแนก( r) เป็นการจำแนกผู้เรียนออกจากกันตามระดับความรู้ความสามารถ ค่า r ควรมีค่าตั้งแต่ 0.20 ขึ้นไป
2. การวิเคราะห์ข้อสอบแบบเลือกตอบแบบอิงเกณฑ์ โดยการตรวจสอบค่าคัชนีความไว ( r ) ของผลการเรียน จะช่วยสะท้อนให้เห็นถึงความสามารถก่อนเรียนกับผลการเรียนรู้หลังการเรียนการสอนแล้ว ข้อสอบที่ดี ควรมี S ตั้งแต่ 0.40 ขึ้นไป
ผลการวิเคราะห์ข้อสอบ ถ้าพบว่า ข้อสอบไม่มีคุณภาพควรกลับมาพิจารณาว่า เกิดจากสาเหตุใด ข้อคำถามไม่มีความเป็นปรนัยหรือไม่ รวมทั้งต้องพิจารณาที่ตัวเลือกด้วยว่า เป็นไปตามหลักการเขียนข้อสอบที่ดีหรือไม่ และดำเนินการปรับปรุงข้อสอบ รวมทั้งนำไป Try out อีกครั้งเพื่อวิเคราะห์ประสิทธิภาพของข้อสอบต่อไป
ท่านใดสนใจโปรแกรมการวิเคราะห์ข้อสอบ สามารถอ่านได้จากบทความ >> ดาวน์โหลดฟรี!! โปรแกรมวิเคราะห์ข้อสอบ EVANA หรือวิเคราะห์ข้อสอบจากโปรแกรม ZipGrade ได้ที่ >> แนะนำ ZipGrade แอปพลิเคชัน ตรวจข้อสอบที่ครูไม่ควรพลาด
ขอบคุณที่มา : โดย พ.ท.หญิง ปวรส บุตะเขียว หน.แผนกประเมินผล และสถิติ โรงเรียนเสนารักข์ กรมแพทย์ทหารบก
บทความที่เกี่ยวข้อง
- ดาวน์โหลดฟรี ตะลุยแนวข้อสอบ ภาษาไทย O-NET ป.6 ฉบับปรับปรุงใหม่ ปีการศึกษา 2564
- ดาวน์โหลดฟรี!! โปรแกรมวิเคราะห์ข้อสอบ EVANA