วันศุกร์ที่ 13 มกราคม พ.ศ. 2555

สถิติเบื้องต้น

           1. ความรู้เบื้องต้นเกี่ยวกับสถิติ
ความหมายของสถิติ
สถิติมีความหมายได้ 2 อย่าง คือ
ก.ในแง่ที่เป็นศาสตร์ หมายถึง 
      1.การวางแผน (planning) ก่อนจะมีการวางแผนต้องมีหัวข้อเรื่องที่จะศึกษาอาทิการแก้ปัญหาเกี่ยวกับเรื่องใดเรื่องหนึ่ง สมมติเป็นปัญหาเกี่ยวกับการขาดแคลนที่จอดรถ ผู้ที่เป็นเจ้าของสถานที่นั้นต้องวางแผนการแก้ปัญหาโดยการจัดหาสถานที่ให้พอเพียง
     2. การเก็บรวบรวมข้อมูล (collection of data) เมื่อกำหนดในขั้นที่ 1 แล้วว่าจะนำอะไรมาเป็นข้อมูล ก็จะทำการรวบรวมตามวิธีการทางสถิติซึ่งจะได้กล่าวต่อไป
     3. การนำเสนอ (Presentation of data) เมื่อรวบรวมได้แล้วก็จะนำมาแสดงให้คนเข้าใจซึ่งอาจจะแสดงในรูป

     4. การวิเคราะห์ข้อมูล (Analysis of data) เมื่อได้ข้อมูลตามต้องการก็จะนำมาวิเคราะห์ซึ่งอาจจะอยู่ในรูป ค่าเฉลี่ย ค่าร้อยละ ค่าสัดส่วน หรือค่าใด ๆ ตามแต่จะกำหนดไว้ในขั้นตอนที่ 1
     5. การตีความ (Interpretation of data) เป็นขั้นตอนสุดท้าย คือ การสรุปผลการวิเคราะห์ในขั้นตอนที่ 4 

ข.ในกรณีเป็นตัวเลข

     หมายถึง ตัวเลขต่าง ๆ อาทิ จำนวนนิสิตที่ลงทะเบียนเรียนวิชาสถิติ 422101 ประจำภาคต้นปี2540 - 41 จำนวน ประชาชนที่มีสิทธิออกเสียงเลือกตั้ง จำนวนทารกแรกเกิดในรอบเดือนจำนวนรถยนต์ที่จดทะเบียนใหม่ในรอบเดือนหรือจำนวนชายไทยวัย 21 ปี ในวันที่ 1 เมษายน2540 เป็นต้น


            2.ประเภทของสถิติ
       สถิติสามารถจำแนกได้เป็น ๒ ประเภท ได้แก่ สถิติเชิงบรรยาย หรือสถิติเชิงพรรณนา (DescriptiveStatistics)  และสถิติเชิงสรุปอ้างอิง หรือสถิติอนุมาน (Inferential Statistics)
       2.1 สถิติเชิงบรรยาย เป็นสถิติที่มุ่งบรรยาย หรืออธิบายลักษณะของสิ่งที่ศึกษา ซึ่งอาจเป็นกลุ่มตัวอย่าง หรือประชากรก็ได้ การบรรยายนั้นมุ่งบรรยายภาพรวมของข้อมูลชุดนั้น ผลของการวิเคราะห์ข้อมูลที่ได้ไม่สามารถนำไปอ้างอิงใช้กับข้อมูลชุดอื่นๆ ได้ เช่น จากการสำรวจความคิดเห็นของนิสิตคณะรัฐศาสตร์กลุ่มหนึ่งได้ข้อสรุป ข้อสรุปนี้เป็นความคิดเห็นของนิสิตคณะรัฐศาสตร์กลุ่มที่สำรวจเท่านั้น ไม่สามารถนำไปสรุปว่าเป็นความคิดเห็นของนิสิตคนอื่นๆ ในมหาวิทยาลัยเดียวกัน   สถิติเชิงบรรยายประกอบด้วย การแจกแจงความถี่ของข้อมูล การนำเสนอข้อมูลในรูปแบบต่างๆ      การจัดตำแหน่งเปรียบเทียบข้อมูล การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจายของข้อมูล และการวัด ความสัมพันธ์ของข้อมูล
       2.2  สถิติเชิงสรุปอ้างอิง เป็นสถิติที่ศึกษาข้อมูลจากกลุ่มตัวอย่างของประชากรที่สนใจ เพื่อให้ได้ค่าสถิติ (Sample statistic)  จากนั้นนำค่าสถิติที่ได้อ้างอิงไปยังประชากร เพื่อประมาณค่าประชากรว่าควรเป็นเท่าไร เช่น การศึกษาความคิดเห็นของนายทหารจำนวนหนึ่ง แล้วสรุปเป็นความคิดเห็นของนายทหารทั้งกองทัพ ซึ่งกรณีนี้การทำให้ได้มาซึ่งกลุ่มตัวอย่างนายทหารจำนวนหนึ่งที่มีความเป็นตัวแทนของนายทหารทั้งกองทัพมีความสำคัญมาก ผู้สนใจสามารถศึกษาได้จากเรื่องการสุ่มตัวอย่าง
สถิติเชิงสรุปอ้างอิงแบ่งได้เป็น ๒ ประเภท ได้แก่ การประมาณค่า (Estimation) และการทดสอบ สมมติฐาน (Hypothesis testing)


3. ข้อมูล ตัวแปร และระดับการวัดตัวแปร
      3.1 ข้อมูล (Data) ก็ได้ข้อมูล เป็นคำกลางๆ ที่ใช้เรียกข่าวสาร หรือข้อเท็จจริงที่อาจเป็นตัวเลขหรือไม่เป็นตัวเลข
     1ข้อมูลที่เป็นตัวเลข เช่น อายุ รายได้ อุณหภูมิ น้ำหนัก เป็นต้น ข้อมูลชนิดนี้จะมีหน่วยการวัด
     2)  ข้อมูลที่ไม่เป็นตัวเลข เช่น ความคิดเห็น อาชีพ เพศ คุณภาพของ สินค้า เป็นต้น   ข้อมูลชนิดนี้จะไม่มีหน่วยการวัด
      3.2 ตัวแปร (Variable) ข้อมูลหรือสิ่งที่เราสนใจศึกษา ซึ่งในการวิจัยเรียกว่าตัวแปรนั้น จะมีค่าแตกต่างกันได้ในกลุ่มที่เราไปศึกษา เช่น เพศของนายทหาร มีทั้งหญิง และชาย ความคิดเห็นอาจมีทั้งเห็นด้วย ไม่เห็นด้วย และไม่มีความเห็น เมื่อเราพิจารณาข้อมูลเรื่องใดเรื่องหนึ่ง ข้อมูลแต่ละเรื่องนั้นก็นับได้ว่าเป็นตัวแปรตัวหนึ่ง เช่น ข้อมูลเกี่ยวกับนายทหาร ประกอบด้วย เพศ อายุ ความสูง น้ำหนัก ชั้นยศ สังกัด  เป็นต้น    ข้อมูลเกี่ยวกับนายทหารแต่ละเรื่องดังกล่าว เป็นสิ่งที่เปลี่ยนแปลงค่าได้ในหมู่นายทหารแต่ละกลุ่ม ข้อมูลดังกล่าวจัดเป็นตัวแปร โดยเพศแปรได้ ๒ ค่า คือ ชาย และหญิง กองทัพแปรได้ ๓ ค่า คือ กองทัพบก กองทัพเรือ และกองทัพอากาศ  ชั้นปีที่ศึกษาอาจแปรได้ ๔ ค่า คือ ชั้นปีที่ ๑, , ๓ และ ๔  หรืออาจกำหนดให้กองทัพแปรค่าได้เพียง ๒ ค่า คือ กองทัพอากาศ และอื่น ตามที่ผู้ศึกษาจะกำหนดขึ้น
    3.3 ระดับการวัดของข้อมูล ข้อมูลสามารถเก็บรวบรวมได้ทั้งจากแหล่งปฐมภูมิ (Primary source)  ซึ่งเป็นแหล่งที่เกิดของข้อมูล และจากแหล่งทุติยภูมิ (Secondary source)  ซึ่งเป็นแหล่งที่รวบรวม  ข้อมูลเอาไว้ก่อนแล้ว ข้อมูลที่รวบรวมได้มาทั้งที่มีค่าเป็นตัวเลขและไม่เป็นตัวเลข สามารถจำแนกประเภทหรือระดับการวัดได้ ๔ ระดับ คือ ระดับกลุ่ม (Nominal scale)  ระดับจัดอันดับ (Ordinal scale)  ระดับช่วง (Interval scale)  และระดับอัตราส่วน (Ratio scale)
               1ข้อมูลระดับกลุ่ม เป็นข้อมูลที่บอกความแตกต่างของสิ่งที่วัดเป็นกลุ่มเป็นพวก เช่น เพศ สังกัด หมายเลขโทรศัพท์ เลขประจำตัว ตัวเลขแบบนี้ไม่มีค่ามากน้อยแตกต่างกัน จะนำมาเปรียบเทียบกันในเชิงพีชคณิตไม่ได้
              2ข้อมูลระดับจัดอันดับหรือเรียงลำดับ เป็นข้อมูลที่ระบุตำแหน่งที่ตั้งเรียงตามลำดับมากหรือน้อย เช่น ยศของทหาร แบ่งได้เป็น นายสิบ นายร้อย นายพัน และนายพล หรือลำดับชั้นของข้าราชการ แบ่งได้เป็น ซีหนึ่ง ซีสอง ถึงซีสิบเอ็ด ตัวแปรประเภทนี้แบ่งเป็นกลุ่มย่อย ๆ ซึ่งสามารถเปรียบเทียบว่ากลุ่มใดสูงกว่ากันได้ แต่ช่วงห่างของแต่ละกลุ่มไม่เท่ากัน จะนำมาเปรียบเทียบในเชิงพีชคณิตไม่ได้
                         3ข้อมูลระดับช่วงหรือระดับอันตรภาค เป็นข้อมูลที่มีค่าเป็นตัวเลข มีช่วงห่างของข้อมูลกลุ่มย่อยเท่าๆ กัน แต่ยังไม่มีค่าศูนย์ที่แท้จริง เช่น อุณหภูมิของอากาศแบ่งเป็นกลุ่มย่อย ทั้งที่อุณหภูมิเป็นบวกและลบ คะแนนจากการสอบซึ่งมีค่าต่างๆ ตั้งแต่ 0 ขึ้นไป ข้อมูลระดับนี้สามารถนำมาเปรียบเทียบความแตกต่างโดยการบวกหรือลบกันได้ แต่ยังเปรียบเทียบเป็นจำนวนเท่าไม่ได้ กล่าวคือ ผู้ที่สอบได้ ๑๐๐ คะแนน ไม่ได้หมายถึงว่ามีความรู้เป็น ๒ เท่าของผู้ที่สอบได้ ๕๐ คะแนน และผู้ที่สอบได้ ๐ คะแนน ก็ไม่ได้หมายถึงไม่มีความรู้ในเรื่องที่สอบเลย
                       4ข้อมูลระดับอัตราส่วน เป็นข้อมูลที่มีค่าเป็นตัวเลข มีช่วงห่างของข้อมูลกลุ่มย่อย  เท่าๆ กัน และมีศูนย์แท้ เช่น รายได้ ความยาว ความสูง น้ำหนัก ข้อมูลระดับนี้สามารถนำมาบวก ลบ คูณ หาร ในเชิงพีชคณิตได้ เช่น ผู้ที่มีรายได้เดือนละ ๓ หมื่นบาท เป็นผู้มีรายได้ ๓ เท่าของผู้ที่มีรายได้ ๑ หมื่นบาท และ ผู้ที่หนัก ๑๐๐ กิโลกรัม หนักเป็น ๒ เท่าของผู้ที่หนัก ๕๐ กิโลกรัม เป็นต้น

คุณสมบัติของข้อมูลระดับต่าง ๆ สรุปได้ดังตาราง 1 - 2

ตาราง 1 - 2  แสดงคุณสมบัติของข้อมูลระดับต่าง ๆ

ระดับการวัด
คุณสมบัติ
การจัดกระทำ
ทางพีชคณิต
ของข้อมูล
จัดกลุ่มได้
เรียงลำดับได้
ช่วงเท่ากัน
มี ศูนย์แท้
บวก/ลบ
คูณ/หาร
ระดับกลุ่ม
ใช่
ไม่ใช่
ไม่ใช่
ไม่ใช่
ไม่ได้
ไม่ได้
ระดับจัดอันดับ
ใช่
ใช่
ไม่ใช่
ไม่ใช่
ไม่ได้
ไม่ได้
ระดับช่วง
ใช่
ใช่
ใช่
ไม่ใช่
ได้
ไม่ได้
ระดับอัตราส่วน
ใช่
ใช่
ใช่
ใช่
ได้
ได้
                               
                ระดับการวัดของข้อมูลทั้ง ๔ ระดับดังกล่าวเรียงลำดับจากการวัดที่หยาบที่สุดถึงละเอียดที่สุดได้ดังนี้ ระดับกลุ่ม ระดับจัดอันดับ ระดับช่วง และระดับอัตราส่วน ข้อมูลจากการวัดเรื่องหนึ่งๆ อาจจำแนกระดับการวัดได้หลายระดับ ขึ้นอยู่กับความต้องการของผู้จำแนกประเภท เช่น ผลการสอบอาจระบุในลักษณะต่างๆ ดังนี้
                                ถ้าระบุว่า สอบ ผ่าน ไม่ผ่านวิชาสถิติ                           เป็นการวัดระดับกลุ่ม
                                ถ้าระบุว่า สอบ ได้ที่ ๑ ๒ ๓                                          เป็นการวัดระดับจัดอันดับ
                                ถ้าระบุว่า สอบได้ ๕๐ ๗๕ ๘๙ คะแนน                        เป็นการวัดระดับช่วง
4. การเลือกใช้สถิติเพื่อวิเคราะห์ข้อมูล
       โดยทั่วไปการวิเคราะห์ข้อมูลที่เก็บรวบรวมมาได้ ก็เพื่อจะตอบคำถามหรือวัตถุประสงค์ที่ตั้งไว้ ซึ่งอาจจำแนกได้ ๒ ลักษณะใหญ่ๆ ได้แก่ เพื่อบรรยายลักษณะของข้อมูล หรืออธิบายความสัมพันธ์ของข้อมูล และเพื่อเปรียบเทียบความแตกต่างของข้อมูล การเลือกใช้สถิติให้เหมาะสม นอกจากจะพิจารณาวัตถุประสงค์ของการวิเคราะห์ข้อมูลแล้ว ต้องพิจารณาว่าข้อมูลหรือตัวแปรมีกี่ตัว และตัวแปรวัดในระดับใด เนื่องจากสถิติที่ใช้วิเคราะห์จะแตกต่างกันไป
       4.1 สถิติสำหรับวิเคราะห์ข้อมูลกรณีมีตัวแปรเดียว
                กรณีตัวแปรมีตัวเดียว การบรรยายลักษณะของข้อมูล มุ่งบรรยายข้อมูลในประเด็นการแจกแจงความถี่ การวัดแนวโน้มเข้าสู่ส่วนกลาง การวัดการกระจาย การวัดความเบ้ และการวัดความโด่ง
                4.1.1) สถิติที่ใช้บรรยายลักษณะของตัวแปรระดับกลุ่ม ได้แก่
               (1) การแจกแจงความถี่  สถิติ ที่เหมาะสมคือ ความถี่ของข้อมูลแต่ละกลุ่มในรูปจำนวน (Frequency)  และร้อยละ (Percent)
               (2) การวัดแนวโน้มเข้าสู่ส่วนกลาง สถิติที่เหมาะสม คือ ฐานนิยม (Mode)
               (3) การวัดการ กระจาย สถิติที่เหมาะสม คือ ความถี่สัมพัทธ์ของข้อมูลที่มีความถี่สูงสุด
               4.1.2) สถิติที่ใช้บรรยายลักษณะตัวแปรระดับจัดอันดับ ได้แก่
               (1)  การแจกแจงความถี่ สถิติที่เหมาะสม คือ ความถี่ของข้อมูลแต่ละกลุ่มในรูปจำนวน และร้อยละ
               (2)  การวัดแนวโน้มเข้าสู่ส่วนกลาง สถิติที่เหมาะสม คือ มัธยฐาน (Median)
               (3)  การวัดการ กระจาย สถิติที่เหมาะสม คือ ส่วนเบี่ยงเบนควอไทล์ (Quartile Deviation)
   4.1.3)  สถิติที่ใช้บรรยายลักษณะตัวแปรระดับช่วง หรือสูงกว่า ได้แก่
               (1)  การแจกแจงความถี่ สถิติที่เหมาะสม คือ ความถี่ของข้อมูลแต่ละช่วงในรูปของจำนวน ร้อยละ และเปอร์เซ็นไทล์ (Percentile) เดไซล์ (Decide)  และควอไทล์ (Quartile)
               (2)  การวัดแนวโน้มเข้าสู่ส่วนกลาง สถิติที่เหมาะสม คือ ค่าเฉลี่ยเลขคณิตหรือมัชฌิมเลขคณิต (Arithmetic Mean)  หรือมัธยฐาน
               (3)  การ กระจาย  สถิติที่เหมาะสมคือ ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation)  และพิสัย (Range)
               (4)  ความเบ้  สถิติที่ใช้วัด คือ ค่าความเบ้ (Skewedness)
               (5)  ความโด่ง สถิติที่ใช้วัด คือ ค่าความโด่ง (Kurtosis)
                การเลือกใช้สถิติเพื่อบรรยายข้อมูลกรณีมีข้อมูลหรือตัวแปรตัวเดียวต้องพิจารณาระดับของข้อมูลและประเด็นที่ต้องการบรรยาย ซึ่งสรุปได้ดังตาราง ๑ -

ตาราง ๑ -   แสดงสถิติที่เหมาะสมในการบรรยายข้อมูลที่มีตัวแปรเดียว

ระดับของตัวแปร
สถิติที่เหมาะสม

การแจกแจงความถี่

การวัดแนวโน้ม
เข้าสู่ส่วนกลาง
การวัดการกระจาย
รูปร่าง
การกระจายตัว
ระดับกลุ่ม
จำนวน ร้อยละ
ฐานนิยม
ความถี่สัมพัทธ์
ไม่มี
ระดับจัดอันดับ
จำนวน ร้อยละ
มัธยฐาน
ส่วนเบี่ยงเบน
ควอไทล์
ไม่มี
ระดับช่วงหรือ
สูงกว่า
เปอร์เซ็นไทล์
ค่าเฉลี่ยเลขคณิตมัธยฐาน
ส่วนเบี่ยงเบน
มาตรฐาน พิสัย
ความเบ้
ความโด่ง

สำหรับกรณีที่มีข้อมูลหรือตัวแปรตัวเดียว ไม่สามารถอธิบายความสัมพันธ์ของข้อมูล หรือเปรียบเทียบความแตกต่างของข้อมูลได้
       4.2 สถิติสำหรับวิเคราะห์ข้อมูลกรณีตัวแปรสองตัว
                ในกรณีที่มีข้อมูลหรือตัวแปรสองตัว วัตถุประสงค์ของการวิเคราะห์ข้อมูลจำแนกได้     ๒ ลักษณะ คือ เพื่ออธิบายความสัมพันธ์ระหว่างตัวแปร และเพื่อเปรียบเทียบความแตกต่างระหว่างตัวแปร     สิ่งที่ต้องพิจารณาต่อไป คือ ระดับการวัดของตัวแปร ซึ่งกรณีที่มีตัวแปรสองตัว จำแนกกรณีต่างๆ ที่เป็นไปได้  ได้ 6 กรณีดังนี้
                                1)  ตัวแปรทั้งสองตัวแปรระดับกลุ่ม
                                2)  ตัวแปรทั้งสองเป็นตัวแปรระดับจัดอันดับ
                                3)  ตัวแปรทั้งสองเป็นตัวแปรระดับช่วงหรือสูงกว่า
                                4)  ตัวแปรตัวหนึ่งเป็นตัวแปรจัดกลุ่ม และอีกตัวแปรหนึ่งเป็นตัวแปรจัดอันดับ
                                5)  ตัวแปรตัวหนึ่งเป็นตัวแปรจัดกลุ่ม และอีกตัวแปรหนึ่งเป็นตัวแปรระดับช่วงหรือสูงกว่า
                                6)  ตัวแปรตัวหนึ่งเป็นตัวแปรจัดอันดับ และอีกตัวแปรหนึ่งเป็นตัวแปรระดับช่วงหรือสูงกว่า
การใช้สถิติที่เหมาะสมสำหรับการวิเคราะห์ตัวแปร  แต่ละกรณี มีดังนี้
             1)  ตัวแปรทั้งสองเป็นตัวแปรระดับกลุ่ม สถิติที่ใช้วิเคราะห์ เช่น ฟี (The Phi coefficient) โคคราน คิว (Cochran Q) เครมเมอร์ส วี (Creamer’s  V)  สัมประสิทธิ์คอนทินเจนซี (The Contingency coefficient)  และไคสแควร์ (Chi-square)  เป็นต้น
2)  ตัวแปรทั้งสองเป็นตัวแปรระดับจัดอันดับ  สถิติที่ใช้วิเคราะห์ เช่น ซอมเม่อร์ส ดี (Somers’ d) สเปียร์แมนโร (Sqearman’s rho) เทา (tau) แกมม่าร์ (gamma)  และคิมส์ ดี (Kim’s d)  เป็นต้น
3)  ตัวแปรทั้งสองตัวแปรระดับช่วง หรือสูงกว่า   สถิติที่ใช้วิเคราะห์ เช่น เพียร์สันโพรดักโมเมนด์ (Pearson’s Product Moment) ไบซีเรียล (Biserial) พอยท์ไบซีเรียล (Point Piserial) เตทตราคอริค (Tetrachoric)  การทดสอบซี (Z-test)  และการทดสอบที (t-test)  เป็นต้น
            4)  ตัวแปรตัวหนึ่งเป็นตัวแปรจัดกลุ่มและอีกตัวแปรหนึ่งเป็นตัวแปรจัดอันดับสถิติที่ใช้วิเคราะห์ เช่น การทดสอบของแมน-วิทนี (The Mann-Whitney U Test)  ซอมเมอร์ส ดี (Somer’s d)      การทดสอบมัธยฐาน (Median test) การทดสอบครูสกัลและวอลลิส (Kruskul - Wallis test)  เป็นต้น
           5)  ตัวแปรตัวหนึ่งเป็นตัวแปรจัดกลุ่ม และอีกตัวแปรหนึ่งเป็นตัวแปรช่วงหรือสูงกว่าสถิติที่ใช้วิเคราะห์ เช่น อีต้าสแควร์ (Eta2) โอเมก้าสแควร์ (Omega2เป็นต้น
           6)  ตัวแปรตัวหนึ่งเป็นตัวแปรจัดอันดับ และอีกตัวแปรหนึ่งเป็นตัวแปรช่วงหรือสูงกว่า สถิติที่ใช้วิเคราะห์ เช่น การหาค่าสหสัมพันธ์แบบมัลติซีเรียลของแจนสเปน (Janspen’s Coefficient of multiserial correlation)
ในการเลือกใช้สถิตินอกจากพิจารณา วัตถุประสงค์ของการวิเคราะห์ข้อมูล จำนวนตัวแปร และระดับการวัดตัวแปรแล้ว ยังต้องพิจารณาเงื่อนไขอื่น ๆ ประกอบด้วย เช่น ลักษณะของตัวแปร (ต่อเนื่อง หรือไม่ต่อเนื่อง) ประเภทของตัวแปร (ตัวแปรอิสระ หรือตัวแปรตาม) ความสัมพันธ์ของตัวแปร (เป็นเส้นตรง หรือเส้นโค้งเป็นต้น นอกจากนี้กรณีที่มีตัวแปรมากกว่าสองตัว วิธีการที่ใช้ก็เพิ่มความซับซ้อนมากขึ้น
2. การแจกแจงความถี่
                การแจกแจงความถี่เป็นการจัดข้อมูลตามค่าของข้อมูล โดยข้อมูลที่มีค่าเท่ากัน จัดให้อยู่ในกลุ่มเดียวกัน แล้วนับจำนวนข้อมูลแต่ละกลุ่มว่ามีจำนวนเท่าใด การแจกแจงความถี่ของข้อมูล ทำได้ 2 วิธี คือ การแจกแจงความถี่ของค่าแต่ละค่าของข้อมูล และการแจกแจงความถี่ของค่าในแต่ละช่วง
                2.1  การแจกแจงความถี่ของค่าแต่ละค่าของข้อมูล หรือการแจกแจงความถี่ของข้อมูลไม่จัดกลุ่ม
                                การแจกแจงข้อมูลวิธีนี้เป็นการนำเอาข้อมูลทั้งหมดมาจัดเรียงตามค่าของข้อมูล โดยอาจเรียงจากข้อมูลที่มีค่ามากไปหาน้อย หรือเรียงจากข้อมูลที่มีค่าน้อยไปหาค่ามากก็ได้ แล้วนับจำนวนข้อมูลแต่ละค่าโดยทำเครื่องหมายขีด (/) แทนจำนวนข้อมูลแต่ละค่า และทุก ๆ ค่าที่ ๕ ทำเครื่องหมายขีดขวางบนเครื่องหมายขีดทั้งสี่ก่อนหน้านี้ ทั้งนี้เพื่อความสะดวกในการนับรอยขีด ของข้อมูลแต่ละค่า

ตัวอย่าง ๒ -    จากการสอบถามพนักงานของหน่วยงานแห่งหนึ่งเกี่ยวกับระยะเวลาที่ทำงานในหน่วยนงานนั้น ปรากฏว่าพนักงาน ๓๐ คน ทำงานคิดระยะเวลาเป็นปีได้ดังนี้
10           5              8              4              12           25           2              9              20           15
5              12           1              3              5              7              17           10           7              14
5              8              13           9              24           5              6              6              6              4

ตารางแจกแจงความถี่ของระยะเวลาการทำงานของพนักงานเรียงจากน้อยไปมาก แสดงได้ดังนี้
ตาราง ๒ - ๑  ระยะเวลาในการทำงานของพนักงานในหน่วยงานแห่งหนึ่ง
ระยะเวลา (ปี)
จำนวนข้อมูล หรือรอยขีด
ความถี่
1
2
3
4
5
6
7
8
9
10
12
13
14
15
17
20
24
25
/
/
/
//
////
///
//
//
//
//
//
/
/
/
/
/
/
/
1
1
1
2
5
3
2
2
2
2
2
1
1
1
1
1
1
1
รวม

30



 วิธีการสร้างตารางแจกแจงความถี่ของค่าในแต่ละช่วง   มีขั้นตอนดังต่อไปนี้
                1)  พิจารณาการกระจายของข้อมูล หรือความแตกต่างระหว่างค่าของข้อมูลว่ามีค่าแตกต่างกันมากหรือน้อย ซึ่งจะเกี่ยวข้องกับการกำหนดช่วงหรืออันตรภาคชั้นของข้อมูล กล่าวคือ ถ้าข้อมูลมีการกระจายมาก ควรกำหนดจำนวนอันตรภาคชั้นให้น้อย เพื่อให้มีข้อมูลทุกช่วง
                2)  กำหนดจำนวนช่วง หรืออันตรภาคชั้น (Class interval)  ของข้อมูลจำนวน ช่วงจะมีมากหรือน้อยขึ้นอยู่กับผู้กำหนด โดยทั่วไปมักกำหนดจำนวนช่วง ประมาณ ๗ - ๑๒ ช่วง
                3)  คำนวณความกว้างของช่วงแต่ละช่วง ( i ) โดยคำนวณจากสูตร


จำนวนช่วง
ความกว้างของช่วง  ( i )  =   ข้อมูลที่มีค่าสูงสุด - ข้อมูลที่มีค่าต่ำสุด

กรณีความกว้างของช่วงที่คำนวณได้เป็นเลขทศนิยม ให้ปัดขึ้นเป็นจำนวนเต็มไม่ว่าทศนิยมจะมีค่ามากกว่าหรือน้อยกว่า .๕ ก็ตาม ถ้า  i = .๔  ให้ใช้ i =
                4)  เขียนช่วงข้อมูลในแต่ละชั้น โดยอาจเริ่มจากชั้นของข้อมูลที่มีค่าต่ำสุดไปหาชั้นของข้อมูลที่มีค่าสูงสุด หรือเริ่มจากชั้นของข้อมูลที่มีค่ามากไปหาชั้นของข้อมูลที่มีค่าน้อยก็ได้
                5)  นับจำนวนค่าของข้อมูลที่ตกอยู่ในแต่ละช่วง โดยทำเครื่องหมายขีด (/) แทนค่าของข้อมูลเช่นเดียวกับการสร้างตารางแจกแจงความถี่ของค่าแต่ละค่า
                6)  หาจำนวนความถี่ของข้อมูลในแต่ละช่วง โดยนับจากรอยขีด
                     จากข้อมูลในตัวอย่าง ๒ - ๑  นำมาสร้างตารางแจกแจงความถี่ของค่าในแต่ละช่วงได้ดังนี้
                                ขั้นที่ ๑  หาการกระจายของข้อมูล
                                                ข้อมูลที่มีค่าสูงสุด - ข้อมูลที่มีค่าต่ำสุด ๒๕ - = ๒๔
                                ขั้นที่ ๒  กำหนดจำนวนช่วง
                                                กำหนดให้ ตารางแจกแจง
                                ขั้นที่ ๓  คำนวณความกว้างของช่วง

                                                ความกว้างของช่วง          =    ๒๔      .๔๓                             

                                ดังนั้น ความกว้างของช่วง คือ   

2.1  คำที่เกี่ยวข้องกับตารางแจกแจงความถี่
                       1)  อันตรภาคชั้น หรือช่วงของข้อมูล (Class interval)  หมายถึง ช่วงของข้อมูลในแต่ละชั้น เช่น อันตรภาคชั้น ๑ - ๔ อันตรภาคชั้น ๕ - ๘ เป็นต้น
                       2จุดกึ่งกลาง  (Mid-point)   คือ ค่าเฉลี่ยระหว่างขอบเขตล่างและขอบเขตบนของแต่ละอันตรภาคชั้น เช่น อันตรภาคชั้น ๕ - ๘ มีจุดกึ่งกลางเป็น    +  =  .
                       3)  ขีดจำกัดชั้น (Class limit)  
                      ขีดจำกัดล่าง (Lower limit)  หมายถึง ค่าต่ำสุดของอันตรภาคชั้นและ
                      ขีดจำกัดบน (Upper limit)  หมายถึง ค่าสูงสุดของอันตรภาคชั้น เช่น อันตรภาคชั้น ๕ - ๘ มี ๕ เป็นขีดจำกัดล่าง และ ๘ เป็นขีดจำกัดบน
          4)  ขอบเขต (Class boundary)

         ขอบเขตล่าง  (Lower boundary)  หมายถึง ขีดจำกัดล่างที่แท้จริงของ ข้อมูลซึ่งเป็นจุดเริ่มต้นของชั้น
         ขอบเขตบน (Upper boundary)  หมายถึง ขีดจำกัดบนที่แท้จริงของข้อมูลซึ่งเป็นจุดสิ้นสุดของชั้น เช่น อันตรภาคชั้น ๕ - ๘ มี ๔.๕ เป็นขอบเขตล่าง และ ๕.๘ เป็นขอบเขตบน โดยทั่วไป ขอบเขตล่างหาได้จากค่าเฉลี่ยระหว่างค่าที่น้อยที่สุดของอันตรภาคชั้น กับค่าที่มากที่สุดของ อันตรภาคชั้นที่อยู่ถัดลงไป และขอบเขตบนหาได้จากค่าเฉลี่ยระหว่างค่าที่มากที่สุดของอันตรภาคชั้นกับค่าที่น้อยที่สุดของอันตรภาคชั้นที่อยู่ถัดขึ้นไป
                จากข้อมูลการทำงานของพนักงานตามตัวอย่าง ๒ - ๓ แสดงค่าที่เกี่ยวข้องกับตารางแจกแจงความถี่ได้ดังนี้

ตาราง ๒ -   จุดกึ่งกลาง และขอบเขตของระยะเวลาการทำงานของพนักงานในหน่วยงานแห่งหนึ่ง

อันตรภาคชั้น
จุดกึ่งกลาง
ขีดจำกัดล่าง
ขีดจำกัดบน
ขอบเขตล่าง
ขอบเขตบน

1 - 4
5 - 8
9 - 12
13 - 16
17 - 20
21 - 24
25 - 28

2.5
6.5
10.5
14.5
18.5
22.5
26.5

1
5
9
13
17
21
25

4
8
12
16
20
24
28

0.5
4.5
8.5
12.5
16.5
20.5
24.5

4.5
8.5
12.5
16.5
20.5
24.5
28.5


 2.2  การแจกแจงความถี่สะสม

                       ข้อมูลจากตารางแจกแจงความถี่จะบอกให้ทราบว่าข้อมูลในแต่ละชั้นมีจำนวนอยู่เท่าใด ถ้าต้องการรายละเอียดเพิ่มขึ้นว่า มีข้อมูลจำนวนเท่าใด มีค่าสูงกว่า หรือต่ำกว่าค่าใดค่าหนึ่งสามารถบอกได้จากค่าความถี่สะสม (Cumulative frequency)
          ความถี่สะสมของข้อมูลใด คือผลรวมของความถี่ของชั้นที่กำหนดให้กับความถี่ของ ชั้นที่มีค่าต่ำกว่าทั้งหมด เช่น จากข้อมูลระยะเวลาการทำงานของพนักงาน ในตาราง ๒ - ๓ สามารถแจกแจงความถี่สะสมได้ดังนี้

ตาราง ๒ - ๕ ความถี่และความถี่สะสมของระยะเวลาการทำงานของพนักงาน

ระยะเวลา (ปี)
ความถี่
ความถี่สะสม
1 - 4
5 - 8
9 - 12
13 - 16
17 - 20
21 - 24
25 - 28
5
12
6
3
2
1
1
5
17
23
26
28
29
30
รวม

30
จากตารางอ่านได้ว่า พนักงานที่ทำงาน ๑ - ๘ ปี มีจำนวน ๑๗ คน พนักงานที่ทำงานระหว่าง ๕ - ๑๖ ปี มีจำนวน ๒๑ คน (๑๒ + + ) พนักงานที่ทำงานไม่เกิน ๒๐ ปี มี ๒๘ คน เป็นต้น

2.3 การแจกแจงความถี่สัมพัทธ์   (Relative frequency)
                       ความถี่สัมพัทธ์ ของข้อมูลใดหมายถึงสัดส่วนของความถี่ของข้อมูลนั้นกับความถี่ทั้งหมด ความถี่สัมพัทธ์อาจแสดงในรูปทศนิยม หรือร้อยละก็ได้ แต่โดยทั่วไปนิยมแสดงในรูปร้อยละ
จากข้อมูลในตาราง ๒ - ๕ แสดงค่าความถี่สัมพัทธ์และความถี่สะสมสัมพัทธ์ได้ดังนี้
ตาราง ๒ -   ความถี่สัมพัทธ์ และความถี่สะสมสัมพัทธ์ของระยะเวลาในการทำงานของพนักงาน

ระยะเวลา (ปี)
ความถี่
ความถี่สะสม
ความถี่สัมพัทธ์
ความถี่สะสมสัมพัทธ์
1 - 4
5 - 8
9 – 12
13 – 16
17 – 20
21 – 24
25 – 28
5
12
6
3
2
1
1
5
17
23
26
28
29
30
16.67
40.00
20.00
10.00
6.67
3.33
3.33
16.67
56.67
76.67
86.67
93.33
96.67
100.00
รวม
30

100.00

ไม่มีความคิดเห็น:

แสดงความคิดเห็น