วิธีการจัดกลุ่มยังช่วยให้คุณวัดได้ รูปแบบต่างๆ(ความแปรปรวนผันผวน) ของสัญญาณ ด้วยจำนวนหน่วยประชากรที่ค่อนข้างน้อย ความแปรผันจะถูกวัดโดยพิจารณาจากชุดของหน่วยที่จัดอันดับซึ่งประกอบขึ้นเป็นประชากร แถวนั้นเรียกว่า อันดับถ้าหน่วยถูกจัดเรียงในลักษณะจากน้อยไปมาก (จากมากไปน้อย)
อย่างไรก็ตาม อนุกรมที่จัดอันดับนั้นค่อนข้างจะบ่งบอกเมื่อจำเป็นต้องมีคุณลักษณะเชิงเปรียบเทียบของการแปรผัน นอกจากนี้ ในหลายกรณี เราต้องจัดการกับผลรวมทางสถิติที่ประกอบด้วยหน่วยจำนวนมาก ซึ่งในทางปฏิบัติยากที่จะแสดงในรูปแบบของชุดข้อมูลเฉพาะ ในเรื่องนี้ สำหรับความคุ้นเคยทั่วไปเบื้องต้นกับข้อมูลทางสถิติและโดยเฉพาะอย่างยิ่งเพื่ออำนวยความสะดวกในการศึกษาความผันแปรของสัญญาณ ปรากฏการณ์และกระบวนการที่ศึกษามักจะรวมกันเป็นกลุ่ม และผลลัพธ์ของการจัดกลุ่มจะถูกวาดขึ้นในรูปแบบของตารางกลุ่ม .
หากมีเพียงสองคอลัมน์ในตารางกลุ่ม - กลุ่มตามคุณสมบัติที่เลือก (ตัวเลือก) และจำนวนกลุ่ม (ความถี่หรือความถี่) จะถูกเรียกว่า ใกล้กระจาย.
ช่วงการจำหน่าย -ประเภทที่ง่ายที่สุดของการจัดกลุ่มโครงสร้างตามแอตทริบิวต์เดียว แสดงในตารางกลุ่มที่มีสองคอลัมน์ที่มีตัวแปรและความถี่ของแอตทริบิวต์ ในหลายกรณีด้วยการจัดกลุ่มโครงสร้างเช่น ด้วยการรวบรวมชุดการแจกจ่าย การศึกษาข้อมูลทางสถิติเบื้องต้นเริ่มต้นขึ้น
การจัดกลุ่มโครงสร้างในรูปแบบของชุดการแจกจ่ายสามารถเปลี่ยนเป็นการจัดกลุ่มโครงสร้างที่แท้จริงได้ หากกลุ่มที่เลือกมีลักษณะเฉพาะไม่เฉพาะตามความถี่เท่านั้น แต่ยังรวมถึงตัวบ่งชี้ทางสถิติอื่นๆ ด้วย จุดประสงค์หลักของชุดการแจกจ่ายคือเพื่อศึกษาความผันแปรของคุณลักษณะต่างๆ ทฤษฎีอนุกรมการแจกแจงได้รับการพัฒนาอย่างละเอียดโดยสถิติทางคณิตศาสตร์
ชุดการจัดจำหน่ายแบ่งออกเป็น แอตทริบิวต์(จัดกลุ่มตามลักษณะเฉพาะตัว เช่น การแบ่งกลุ่มประชากรตามเพศ สัญชาติ สถานภาพสมรส เป็นต้น) และ ผันแปร(จัดกลุ่มตามลักษณะเชิงปริมาณ)
ชุดตัวแปรเป็นตารางกลุ่มที่มีสองคอลัมน์: การจัดกลุ่มของหน่วยตามแอตทริบิวต์เชิงปริมาณหนึ่งรายการและจำนวนหน่วยในแต่ละกลุ่ม ช่วงเวลาในอนุกรมความแปรผันมักจะเกิดขึ้นเท่ากันและปิด ซีรีส์รูปแบบต่างๆคือกลุ่มต่อไปของประชากรรัสเซียในแง่ของรายได้เงินสดต่อหัว (ตารางที่ 3.10)
ตาราง 3.10
การกระจายตัวของประชากรรัสเซียตามรายได้เฉลี่ยต่อหัวในปี 2547-2552
กลุ่มประชากรตามรายได้เงินสดเฉลี่ยต่อหัว rub./เดือน |
ประชากรในกลุ่มคิดเป็น % ของทั้งหมด |
|||||
8 000,1-10 000,0 |
||||||
10 000,1-15 000,0 |
||||||
15 000,1-25 000,0 |
||||||
มากกว่า 25,000.0 |
||||||
ประชากรทั้งหมด |
ในทางกลับกัน อนุกรมแบบแปรผันจะแบ่งออกเป็นแบบไม่ต่อเนื่องและแบบช่วง ไม่ต่อเนื่องซีรีส์รูปแบบต่างๆ ผสมผสานรูปแบบต่างๆ ของคุณลักษณะที่ไม่ต่อเนื่องซึ่งแตกต่างกันภายในขอบเขตที่แคบ ตัวอย่างของชุดรูปแบบที่ไม่ต่อเนื่องคือการกระจายครอบครัวรัสเซียตามจำนวนเด็กที่พวกเขามี
ช่วงเวลาซีรีส์ Variational Series ผสมผสานรูปแบบต่างๆ ของคุณลักษณะที่ต่อเนื่องกันหรือคุณลักษณะที่ไม่ต่อเนื่องซึ่งเปลี่ยนแปลงไปในวงกว้าง อนุกรมช่วงเวลาคือชุดที่แปรผันของการกระจายตัวของประชากรรัสเซียในแง่ของรายได้เงินสดเฉลี่ยต่อหัว
ในทางปฏิบัติไม่ได้ใช้อนุกรมวิธานแบบแยกส่วนบ่อยนัก ในขณะเดียวกัน การรวบรวมพวกมันก็ไม่ใช่เรื่องยาก เนื่องจากองค์ประกอบของกลุ่มถูกกำหนดโดยตัวแปรเฉพาะที่ลักษณะการจัดกลุ่มที่ศึกษามีอยู่จริง
อนุกรมวิธานแบบช่วงเวลาจะแพร่หลายมากขึ้น ในการรวบรวมคำถามที่ยากเกิดขึ้นจากจำนวนกลุ่มตลอดจนขนาดของช่วงเวลาที่ควรกำหนด
หลักการในการแก้ไขปัญหานี้มีระบุไว้ในบทเกี่ยวกับวิธีการสร้างการจัดกลุ่มทางสถิติ (ดูย่อหน้าที่ 3.3)
ชุดความแปรปรวนเป็นวิธีการยุบหรือบีบอัดข้อมูลที่หลากหลายให้อยู่ในรูปแบบกะทัดรัด สามารถใช้เพื่อสร้างการตัดสินใจที่ชัดเจนพอสมควรเกี่ยวกับธรรมชาติของการแปรผัน เพื่อศึกษาความแตกต่างในสัญญาณของปรากฏการณ์ที่รวมอยู่ในฉากที่กำลังศึกษา แต่ความสำคัญที่สำคัญที่สุดของอนุกรมความแปรผันคือโดยพื้นฐานแล้ว ลักษณะทั่วไปพิเศษของการแปรผันจะถูกคำนวณ (ดูบทที่ 7)
ผันแปรเรียกว่าชุดการแจกจ่ายที่สร้างขึ้นบนพื้นฐานเชิงปริมาณ ค่าของลักษณะเชิงปริมาณในแต่ละหน่วยของประชากรไม่คงที่ แตกต่างกันมากหรือน้อย
Variation- ความผันผวนความแปรปรวนของค่าแอตทริบิวต์ในหน่วยของประชากร แยก ค่าตัวเลขลักษณะที่เกิดขึ้นในกลุ่มประชากรที่ศึกษาเรียกว่า ตัวเลือกค่า ความไม่เพียงพอของค่าเฉลี่ยสำหรับการกำหนดลักษณะที่สมบูรณ์ของประชากรทำให้จำเป็นต้องเสริมค่าเฉลี่ยด้วยตัวบ่งชี้ที่ทำให้สามารถประเมินลักษณะทั่วไปของค่าเฉลี่ยเหล่านี้ได้โดยการวัดความผันผวน (การเปลี่ยนแปลง) ของลักษณะภายใต้การศึกษา
การปรากฏตัวของการเปลี่ยนแปลงนั้นเกิดจากอิทธิพลของปัจจัยจำนวนมากต่อการก่อตัวของระดับลักษณะ ปัจจัยเหล่านี้กระทำการด้วยแรงที่ไม่เท่ากันและในทิศทางที่ต่างกัน ตัวบ่งชี้การเปลี่ยนแปลงใช้เพื่ออธิบายการวัดความแปรปรวนของลักษณะ
งานของการศึกษาทางสถิติของการแปรผัน:
- 1) การศึกษาธรรมชาติและระดับความแปรปรวนของสัญญาณในแต่ละหน่วยของประชากร
- 2) การกำหนดบทบาทของปัจจัยส่วนบุคคลหรือกลุ่มของพวกเขาในการเปลี่ยนแปลงของคุณลักษณะบางอย่างของประชากร
ในสถิติจะใช้วิธีการพิเศษในการศึกษาความแปรผันตามการใช้ระบบตัวบ่งชี้ กับโดยที่ความแปรปรวนจะถูกวัด
การศึกษาความผันแปรเป็นสิ่งสำคัญ การวัดความแปรปรวนเป็นสิ่งจำเป็นเมื่อทำการสังเกตตัวอย่าง การวิเคราะห์สหสัมพันธ์และการวิเคราะห์ความแปรปรวน ฯลฯ Ermolaev O.Yu. สถิติทางคณิตศาสตร์สำหรับนักจิตวิทยา: ตำรา [ข้อความ] / O.Yu. เออร์โมเลฟ - M .: Flint Publishing House ของสถาบันจิตวิทยาและสังคมมอสโก 2555 - 335p
ตามระดับของการเปลี่ยนแปลง เราสามารถตัดสินความเป็นเนื้อเดียวกันของประชากร ความเสถียรของค่าคุณลักษณะส่วนบุคคล และลักษณะทั่วไปของค่าเฉลี่ย บนพื้นฐานของตัวบ่งชี้ความใกล้ชิดของความสัมพันธ์ระหว่างสัญญาณตัวบ่งชี้สำหรับการประเมินความถูกต้องของการสังเกตแบบคัดเลือกได้รับการพัฒนา
มีการเปลี่ยนแปลงในอวกาศและการเปลี่ยนแปลงในเวลา
ความแปรปรวนในอวกาศเป็นที่เข้าใจกันว่าความผันผวนของค่าคุณลักษณะในหน่วยของประชากรที่เป็นตัวแทนของอาณาเขตที่แยกจากกัน ภายใต้การเปลี่ยนแปลงของเวลาหมายถึงการเปลี่ยนแปลงในค่าของแอตทริบิวต์ในช่วงเวลาต่างๆ
เพื่อศึกษาความแปรผันในอนุกรมการแจกแจง ตัวแปรทั้งหมดของค่าแอตทริบิวต์จะเรียงลำดับจากน้อยไปมากหรือมากไปหาน้อย กระบวนการนี้เรียกว่าการจัดอันดับซีรีส์
สัญญาณการเปลี่ยนแปลงที่ง่ายที่สุดคือ ต่ำสุดและสูงสุด- ค่าที่เล็กที่สุดและใหญ่ที่สุดของแอตทริบิวต์ในผลรวม จำนวนการทำซ้ำของค่าคุณลักษณะแต่ละตัวแปรเรียกว่าความถี่ของการทำซ้ำ (fi) สะดวกในการเปลี่ยนความถี่ด้วยความถี่ - wi ความถี่ - ตัวบ่งชี้ความถี่สัมพัทธ์ ซึ่งสามารถแสดงเป็นเศษส่วนของหน่วยหรือเปอร์เซ็นต์ และช่วยให้คุณสามารถเปรียบเทียบชุดรูปแบบต่างๆ กับจำนวนการสังเกตที่ต่างกันได้ แสดงโดยสูตร:
โดยที่ Xmax, Xmin - ค่าสูงสุดและต่ำสุดของแอตทริบิวต์โดยรวม n คือจำนวนกลุ่ม
ในการวัดความผันแปรของคุณลักษณะ จะใช้ตัวบ่งชี้แบบสัมบูรณ์และแบบสัมพัทธ์ต่างๆ ตัวชี้วัดความผันแปรแบบสัมบูรณ์รวมถึงช่วงของการเปลี่ยนแปลง ความเบี่ยงเบนเชิงเส้นเฉลี่ย ความแปรปรวน ส่วนเบี่ยงเบนมาตรฐาน ตัวบ่งชี้สัมพัทธ์ของความผันผวนประกอบด้วยค่าสัมประสิทธิ์การสั่น ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์ ค่าสัมประสิทธิ์การแปรผัน
ตัวอย่างการหาชุดตัวแปร
ออกกำลังกาย.สำหรับตัวอย่างนี้:
- ก) ค้นหาชุดการเปลี่ยนแปลง
- b) สร้างฟังก์ชันการกระจาย
เลขที่=42. รายการตัวอย่าง:
1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2
วิธีการแก้.
- ก) การสร้างชุดตัวแปรที่จัดอันดับ:
- 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
- b) การสร้างชุดตัวแปรแบบแยกส่วน
มาคำนวณจำนวนกลุ่มในชุดตัวแปรโดยใช้สูตร Sturgess:
ลองหาจำนวนกลุ่มที่เท่ากับ 7
เมื่อทราบจำนวนกลุ่มเราคำนวณค่าของช่วงเวลา:
เพื่อความสะดวกในการสร้างตารางเราจะเอาจำนวนกลุ่มเท่ากับ 8 ช่วงจะเป็น 1
ข้าว. หนึ่ง ปริมาณการขายสินค้าโดยร้านค้าในช่วงระยะเวลาหนึ่ง
แถวที่สร้าง ตามปริมาณเรียกว่า ผันแปร.
ชุดการจัดจำหน่ายประกอบด้วย ตัวเลือก(ค่าลักษณะเฉพาะ) และ ความถี่(จำนวนกลุ่ม). ความถี่ที่แสดงเป็นค่าสัมพัทธ์ (ส่วนแบ่ง, เปอร์เซ็นต์) เรียกว่า ความถี่. ผลรวมของความถี่ทั้งหมดเรียกว่าปริมาตรของอนุกรมการแจกแจง
ตามประเภท ชุดการแจกจ่ายจะแบ่งออกเป็น ไม่ต่อเนื่อง(สร้างขึ้นจากค่าที่ไม่ต่อเนื่องของคุณสมบัติ) และ ช่วงเวลา(สร้างขึ้นจากค่าคุณสมบัติต่อเนื่อง)
ชุดตัวแปรหมายถึงสองคอลัมน์ (หรือแถว); หนึ่งในนั้นให้ค่าแต่ละค่าของแอตทริบิวต์ตัวแปรที่เรียกว่าตัวแปรและแสดงโดย X; และอีกนัยหนึ่ง - ตัวเลขสัมบูรณ์แสดงจำนวนครั้งที่แต่ละตัวเลือกเกิดขึ้น (บ่อยแค่ไหน) ตัวบ่งชี้ของคอลัมน์ที่สองเรียกว่าความถี่และแสดงด้วย f ตามอัตภาพ เราทราบอีกครั้งว่าในคอลัมน์ที่สอง ตัวบ่งชี้สัมพัทธ์ที่แสดงลักษณะส่วนแบ่งของความถี่ของตัวแปรแต่ละตัวในจำนวนความถี่ทั้งหมดก็สามารถใช้ได้เช่นกัน ตัวบ่งชี้สัมพัทธ์เหล่านี้เรียกว่าความถี่และแสดงตามอัตภาพโดย ω ผลรวมของความถี่ทั้งหมดในกรณีนี้จะเท่ากับหนึ่ง อย่างไรก็ตาม ความถี่ยังสามารถแสดงเป็นเปอร์เซ็นต์ จากนั้นผลรวมของความถี่ทั้งหมดจะให้ 100%
หากตัวแปรของอนุกรมผันแปรแสดงเป็น ปริมาณที่ไม่ต่อเนื่องจากนั้นจึงเรียกอนุกรมวิธานดังกล่าวว่า ไม่ต่อเนื่อง
สำหรับคุณสมบัติต่อเนื่อง ซีรีย์รูปแบบต่างๆ จะถูกสร้างเป็น ช่วงเวลานั่นคือค่าของแอตทริบิวต์ในนั้นแสดง "จาก ... ถึง ... " ในกรณีนี้ค่าต่ำสุดของแอตทริบิวต์ในช่วงเวลาดังกล่าวเรียกว่าขีด จำกัด ล่างของช่วงเวลาและค่าสูงสุด - ขีด จำกัด บน
นอกจากนี้ ซีรีย์ Interval Variational ยังสร้างขึ้นสำหรับคุณสมบัติที่ไม่ต่อเนื่องซึ่งแตกต่างกันไปตามช่วงกว้าง อนุกรมช่วงเวลาสามารถเป็น เท่ากันและ ไม่เท่ากันช่วงเวลา
พิจารณาวิธีการหาค่าของช่วงที่เท่ากัน ให้เราแนะนำสัญกรณ์ต่อไปนี้:
ผม– ค่าช่วง;
- ค่าสูงสุดของแอตทริบิวต์สำหรับหน่วยของประชากร
- ค่าต่ำสุดของแอตทริบิวต์สำหรับหน่วยของประชากร
น-จำนวนกลุ่มที่ได้รับการจัดสรร
ถ้า n เป็นที่รู้จัก
หากจำนวนกลุ่มที่ได้รับการจัดสรรนั้นยากต่อการกำหนดล่วงหน้า ขอแนะนำให้ใช้สูตรที่เสนอโดย Sturgess ในปี 1926 เพื่อคำนวณขนาดที่เหมาะสมที่สุดของช่วงเวลาด้วยขนาดประชากรที่เพียงพอ:
n = 1+ 3.322 log N โดยที่ N คือจำนวนประชากรในประชากร
ค่าของช่วงที่ไม่เท่ากันจะถูกกำหนดในแต่ละกรณี โดยคำนึงถึงลักษณะของวัตถุที่ศึกษา
การกระจายทางสถิติของกลุ่มตัวอย่างเรียกรายการตัวเลือกและความถี่ที่เกี่ยวข้อง (หรือความถี่สัมพัทธ์)
การกระจายทางสถิติของกลุ่มตัวอย่างสามารถระบุได้ในรูปแบบของตาราง ในคอลัมน์แรกซึ่งมีตัวเลือก และในคอลัมน์ที่สอง - ความถี่ที่สอดคล้องกับตัวเลือกเหล่านี้ นิหรือความถี่สัมพัทธ์ ปี่ .
การกระจายทางสถิติของกลุ่มตัวอย่าง
อนุกรมช่วงเวลาเรียกว่า อนุกรมความแปรผัน ซึ่งค่าของคุณสมบัติที่อยู่ภายใต้การก่อตัวของพวกมันจะแสดงภายในขอบเขตที่แน่นอน (ช่วงเวลา) ความถี่ในกรณีนี้ไม่ได้หมายถึงค่าแต่ละค่าของแอตทริบิวต์ แต่หมายถึงช่วงทั้งหมด
อนุกรมการแจกแจงแบบช่วงเวลาถูกสร้างขึ้นตามลักษณะเชิงปริมาณอย่างต่อเนื่อง เช่นเดียวกับลักษณะเฉพาะที่ไม่ต่อเนื่อง ซึ่งแตกต่างกันภายในช่วงที่มีนัยสำคัญ
อนุกรมช่วงเวลาสามารถแสดงได้ด้วยการแจกแจงทางสถิติของตัวอย่าง โดยระบุช่วงเวลาและความถี่ที่สอดคล้องกัน ในกรณีนี้ ผลรวมของความถี่ของตัวแปรที่อยู่ในช่วงนี้จะถูกนำมาเป็นความถี่ของช่วงเวลา
เมื่อจัดกลุ่มตามคุณลักษณะต่อเนื่องเชิงปริมาณ การกำหนดขนาดของช่วงเวลาเป็นสิ่งสำคัญ
นอกจากค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างแล้ว ยังใช้คุณลักษณะอื่นๆ ของชุดการแปรผันด้วย
แฟชั่นตั้งชื่อตัวแปรที่มีความถี่สูงสุด
อนุกรมการแจกแจงทางสถิติ- นี่คือการกระจายตามลำดับของหน่วยประชากรออกเป็นกลุ่มตามคุณลักษณะที่แตกต่างกันขึ้นอยู่กับลักษณะที่อยู่ภายใต้การก่อตัวของอนุกรมการแจกแจงมี แอตทริบิวต์และชุดการกระจายรูปแบบ.
การมีอยู่ของคุณลักษณะทั่วไปเป็นพื้นฐานสำหรับการก่อตัวของประชากรทางสถิติ ซึ่งเป็นผลมาจากคำอธิบายหรือการวัดลักษณะทั่วไปของวัตถุที่ศึกษา
วิชาที่ศึกษาทางสถิติมีการเปลี่ยนแปลง (ต่างกัน) ลักษณะหรือลักษณะทางสถิติ
ประเภทของคุณสมบัติทางสถิติ.
ชุดการแจกจ่ายเรียกว่าชุดคุณลักษณะสร้างขึ้นบนพื้นฐานคุณภาพ แอตทริบิวต์- นี่คือสัญญาณที่มีชื่อ (เช่น อาชีพ: ช่างเย็บผ้า ครู ฯลฯ )
เป็นเรื่องปกติที่จะจัดเรียงชุดการแจกจ่ายในรูปแบบของตาราง ในตาราง. 2.8 แสดงชุดแอตทริบิวต์ของการกระจาย
ตารางที่ 2.8 - การแจกจ่ายประเภทของความช่วยเหลือทางกฎหมายที่ทนายความมอบให้กับพลเมืองในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซีย
ชุดตัวแปรคือชุดการกระจายสร้างขึ้นบนพื้นฐานเชิงปริมาณ ชุดตัวแปรใด ๆ ประกอบด้วยสององค์ประกอบ: ตัวแปรและความถี่
ตัวแปรคือค่าแต่ละค่าของคุณลักษณะที่ใช้ในชุดรูปแบบต่างๆ
ความถี่คือตัวเลขของตัวแปรแต่ละตัวหรือแต่ละกลุ่มของชุดรูปแบบการแปรผัน กล่าวคือ ตัวเลขเหล่านี้เป็นตัวเลขที่แสดงว่าตัวเลือกบางอย่างเกิดขึ้นในชุดการแจกจ่ายบ่อยเพียงใด ผลรวมของความถี่ทั้งหมดกำหนดขนาดของประชากรทั้งหมด ปริมาตรของมัน
ความถี่เรียกว่าความถี่ซึ่งแสดงเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของผลรวม ดังนั้น ผลรวมของความถี่จะเท่ากับ 1 หรือ 100% อนุกรมความแปรปรวนช่วยให้เราสามารถประเมินรูปแบบของกฎหมายการจัดจำหน่ายโดยพิจารณาจากข้อมูลจริง
ขึ้นอยู่กับลักษณะของความผันแปรของลักษณะมี อนุกรมความแปรผันแบบไม่ต่อเนื่องและตามช่วงเวลา.
ตัวอย่างของชุดตัวแปรแบบแยกส่วนแสดงไว้ในตาราง 2.9.
ตารางที่ 2.9 - การกระจายของครอบครัวตามจำนวนห้องที่ถูกครอบครองในอพาร์ตเมนต์แต่ละห้องในปี 1989 ในสหพันธรัฐรัสเซีย
ชุดตัวแปร
ในประชากรทั่วไป กำลังตรวจสอบลักษณะเชิงปริมาณบางอย่าง สุ่มตัวอย่างปริมาตรจากมัน นนั่นคือจำนวนองค์ประกอบในตัวอย่างคือ น. ในขั้นตอนแรกของการประมวลผลทางสถิติ หลากหลายตัวอย่าง เช่น การสั่งซื้อหมายเลข x 1 , x 2 , …, x นจากน้อยไปมาก. แต่ละค่าที่สังเกตได้ x ฉันเรียกว่า ตัวเลือก. ความถี่ ฉันคือจำนวนการสังเกตของค่า x ฉันในตัวอย่าง ความถี่สัมพัทธ์ (ความถี่) ฉันคืออัตราส่วนความถี่ ฉันขนาดตัวอย่าง น: .เมื่อศึกษาอนุกรมความแปรผัน แนวคิดของความถี่สะสมและความถี่สะสมก็ถูกนำมาใช้เช่นกัน อนุญาต xตัวเลขบางส่วน จากนั้นจำนวนตัวเลือก , ที่มีค่าน้อยกว่า xเรียกว่าความถี่สะสม สำหรับ x i
คุณลักษณะเรียกว่าตัวแปรแบบไม่ต่อเนื่องหากค่าแต่ละค่า (ตัวแปร) แตกต่างกันตามจำนวนที่ จำกัด (โดยปกติเป็นจำนวนเต็ม) อนุกรมผันแปรของคุณลักษณะดังกล่าวเรียกว่าชุดแปรผันที่ไม่ต่อเนื่อง
ตารางที่ 1. มุมมองทั่วไปของชุดความถี่แบบแปรผันที่ไม่ต่อเนื่อง
ค่าคุณสมบัติ | x ฉัน | x 1 | x2 | … | x น |
ความถี่ | ฉัน | ม.1 | m2 | … | ม น |
คุณลักษณะจะเรียกว่าแปรผันอย่างต่อเนื่องหากค่าของมันแตกต่างกันในปริมาณเล็กน้อยโดยพลการเช่น เครื่องหมายสามารถรับค่าใดก็ได้ในช่วงเวลาหนึ่ง อนุกรมความแปรผันต่อเนื่องสำหรับคุณลักษณะดังกล่าวเรียกว่า อนุกรมช่วงเวลา
ตารางที่ 2. มุมมองทั่วไปของชุดความถี่ที่แปรผันตามช่วงเวลา
ตารางที่ 3 ภาพกราฟิกของชุดรูปแบบต่างๆ
แถว | รูปหลายเหลี่ยมหรือฮิสโตแกรม | ฟังก์ชันการกระจายเชิงประจักษ์ | |
ไม่ต่อเนื่อง | |||
ช่วงเวลา |
สำหรับการแสดงกราฟิกของอนุกรมแบบแปรผัน มักใช้รูปหลายเหลี่ยม ฮิสโตแกรม เส้นโค้งสะสม และฟังก์ชันการกระจายเชิงประจักษ์
ในตาราง. 2.3 (การจัดกลุ่มประชากรของรัสเซียตามขนาดของรายได้เฉลี่ยต่อหัวในเดือนเมษายน 1994) นำเสนอ อนุกรมความผันแปรตามช่วงเวลา.
สะดวกในการวิเคราะห์ชุดการแจกจ่ายโดยใช้การแสดงแบบกราฟิก ซึ่งทำให้สามารถตัดสินรูปร่างของการแจกแจงได้ การแสดงภาพของธรรมชาติของการเปลี่ยนแปลงในความถี่ของอนุกรมผันแปรได้มาจาก รูปหลายเหลี่ยมและฮิสโตแกรม.
ใช้รูปหลายเหลี่ยมเมื่อแสดงอนุกรมที่แปรผันไม่ต่อเนื่อง.
ให้เราอธิบายตัวอย่างเช่นการแจกแจงหุ้นที่อยู่อาศัยตามประเภทของอพาร์ทเมนท์ (ตารางที่ 2.10) แบบกราฟิก
ตารางที่ 2.10 - การกระจายสต็อกที่อยู่อาศัยในเขตเมืองตามประเภทของอพาร์ทเมนท์ (ตัวเลขตามเงื่อนไข)
ข้าว. รูปหลายเหลี่ยมการกระจายที่อยู่อาศัย
บนแกน y ไม่เพียงแต่สามารถพล็อตค่าของความถี่เท่านั้น แต่ยังสามารถพล็อตความถี่ของอนุกรมรูปแบบต่างๆ ได้อีกด้วย
ฮิสโตแกรมถูกนำมาใช้เพื่อแสดงชุดรูปแบบช่วงเวลา. เมื่อสร้างฮิสโตแกรม ค่าของช่วงเวลาจะถูกพล็อตบนแกน abscissa และแสดงความถี่ด้วยสี่เหลี่ยมที่สร้างขึ้นในช่วงเวลาที่เกี่ยวข้อง ความสูงของคอลัมน์ในกรณีที่มีช่วงเท่ากันควรเป็นสัดส่วนกับความถี่ ฮิสโตแกรมคือกราฟที่แสดงชุดข้อมูลเป็นแท่งที่อยู่ติดกัน
มาวาดชุดการแจกแจงตามช่วงเวลาแบบกราฟิกกันในตารางกัน 2.11.
ตารางที่ 2.11 - การกระจายของครอบครัวตามขนาดพื้นที่ใช้สอยต่อคน (ตัวเลขตามเงื่อนไข)
ไม่มี p / p | กลุ่มครอบครัวตามขนาดพื้นที่ใช้สอยต่อท่าน | จำนวนครอบครัวที่มีขนาดพื้นที่ใช้สอยที่กำหนด | จำนวนครอบครัวสะสม |
1 | 3 – 5 | 10 | 10 |
2 | 5 – 7 | 20 | 30 |
3 | 7 – 9 | 40 | 70 |
4 | 9 – 11 | 30 | 100 |
5 | 11 – 13 | 15 | 115 |
ทั้งหมด | 115 | ---- |
ข้าว. 2.2. ฮิสโตแกรมของการกระจายของครอบครัวตามขนาดพื้นที่ใช้สอยต่อคน
โดยใช้ข้อมูลของชุดสะสม (ตาราง 2.11) เราสร้าง การกระจายสะสม
ข้าว. 2.3. การกระจายสะสมของครอบครัวตามขนาดพื้นที่ใช้สอยต่อคน
การแสดงชุดความแปรผันในรูปแบบของการสะสมมีประสิทธิภาพโดยเฉพาะอย่างยิ่งสำหรับอนุกรมผันแปร ซึ่งความถี่จะแสดงเป็นเศษส่วนหรือเปอร์เซ็นต์ของผลรวมของความถี่ของชุดข้อมูล
หากเราเปลี่ยนแกนในการแสดงกราฟิกของอนุกรมผันแปรในรูปของสะสม เราก็จะได้ ogivu. ในรูป 2.4 แสดง ogive ที่สร้างขึ้นบนพื้นฐานของข้อมูลในตาราง 2.11.
ฮิสโตแกรมสามารถแปลงเป็นรูปหลายเหลี่ยมการกระจายได้โดยการหาจุดกึ่งกลางของด้านข้างของสี่เหลี่ยมแล้วเชื่อมต่อจุดเหล่านี้ด้วยเส้นตรง รูปหลายเหลี่ยมการกระจายผลลัพธ์จะแสดงในรูปที่ 2.2 เส้นประ
เมื่อสร้างฮิสโตแกรมของการแจกแจงอนุกรมแบบแปรผันที่มีช่วงระยะไม่เท่ากัน จะไม่ใช้ความถี่ในแกนของพิกัด แต่จะใช้ความหนาแน่นของการกระจายของจุดสนใจในช่วงเวลาที่สอดคล้องกัน
ความหนาแน่นของการกระจายคือความถี่ที่คำนวณต่อความกว้างของช่วงหน่วย กล่าวคือ จำนวนหน่วยในแต่ละกลุ่มเป็นค่าช่วงต่อหน่วย ตัวอย่างการคำนวณความหนาแน่นของการกระจายแสดงในตาราง 2.12.
ตารางที่ 2.12 - การกระจายวิสาหกิจตามจำนวนพนักงาน (ตัวเลขมีเงื่อนไข)
ไม่มี p / p | กลุ่มวิสาหกิจตามจำนวนพนักงานรายบุคคล | จำนวนสถานประกอบการ | ขนาดช่วงต่อ | ความหนาแน่นของการกระจาย |
แต่ | 1 | 2 | 3=1/2 | |
1 | มากถึง 20 | 15 | 20 | 0,75 |
2 | 20 – 80 | 27 | 60 | 0,25 |
3 | 80 – 150 | 35 | 70 | 0,5 |
4 | 150 – 300 | 60 | 150 | 0,4 |
5 | 300 – 500 | 10 | 200 | 0,05 |
ทั้งหมด | 147 | ---- | ---- |
สำหรับการแสดงกราฟิกของชุดรูปแบบต่างๆ ก็สามารถใช้ได้เช่นกัน เส้นโค้งสะสม. ด้วยความช่วยเหลือของสะสม (เส้นโค้งของผลรวม) ชุดของความถี่สะสมจะปรากฏขึ้น ความถี่สะสมถูกกำหนดโดยการสรุปความถี่ตามลำดับโดยกลุ่มและแสดงจำนวนหน่วยของประชากรที่มีค่าคุณลักษณะไม่เกินค่าที่พิจารณา
ข้าว. 2.4. Ogiva แบ่งครอบครัวตามขนาดพื้นที่ใช้สอยต่อคน
เมื่อสร้างชุดสะสมของอนุกรมความแปรผันตามช่วงเวลา ตัวแปรของชุดข้อมูลจะถูกพล็อตตามแกน abscissa และความถี่สะสมตามแกนพิกัด
ซีรีย์รูปแบบต่อเนื่อง
อนุกรมผันแปรต่อเนื่องเป็นอนุกรมที่สร้างขึ้นบนพื้นฐานของ คุณสมบัติทางสถิติเชิงปริมาณ. ตัวอย่าง. ระยะเวลาเฉลี่ยของโรคของนักโทษ (วันต่อคน) ในช่วงฤดูใบไม้ร่วงฤดูหนาวในปีปัจจุบันคือ:7,0 | 6,0 | 5,9 | 9,4 | 6,5 | 7,3 | 7,6 | 9,3 | 5,8 | 7,2 |
7,1 | 8,3 | 7,5 | 6,8 | 7,1 | 9,2 | 6,1 | 8,5 | 7,4 | 7,8 |
10,2 | 9,4 | 8,8 | 8,3 | 7,9 | 9,2 | 8,9 | 9,0 | 8,7 | 8,5 |