ตามตัวอย่างนี้ ให้สร้างชุดรูปแบบช่วงเวลา วิธีแก้ปัญหา: ฉัน

วิธีการจัดกลุ่มยังช่วยให้คุณวัดได้ รูปแบบต่างๆ(ความแปรปรวนผันผวน) ของสัญญาณ ด้วยจำนวนหน่วยประชากรที่ค่อนข้างน้อย ความแปรผันจะถูกวัดโดยพิจารณาจากชุดของหน่วยที่จัดอันดับซึ่งประกอบขึ้นเป็นประชากร แถวนั้นเรียกว่า อันดับถ้าหน่วยถูกจัดเรียงในลักษณะจากน้อยไปมาก (จากมากไปน้อย)

อย่างไรก็ตาม อนุกรมที่จัดอันดับนั้นค่อนข้างจะบ่งบอกเมื่อจำเป็นต้องมีคุณลักษณะเชิงเปรียบเทียบของการแปรผัน นอกจากนี้ ในหลายกรณี เราต้องจัดการกับผลรวมทางสถิติที่ประกอบด้วยหน่วยจำนวนมาก ซึ่งในทางปฏิบัติยากที่จะแสดงในรูปแบบของชุดข้อมูลเฉพาะ ในเรื่องนี้ สำหรับความคุ้นเคยทั่วไปเบื้องต้นกับข้อมูลทางสถิติและโดยเฉพาะอย่างยิ่งเพื่ออำนวยความสะดวกในการศึกษาความผันแปรของสัญญาณ ปรากฏการณ์และกระบวนการที่ศึกษามักจะรวมกันเป็นกลุ่ม และผลลัพธ์ของการจัดกลุ่มจะถูกวาดขึ้นในรูปแบบของตารางกลุ่ม .

หากมีเพียงสองคอลัมน์ในตารางกลุ่ม - กลุ่มตามคุณสมบัติที่เลือก (ตัวเลือก) และจำนวนกลุ่ม (ความถี่หรือความถี่) จะถูกเรียกว่า ใกล้กระจาย.

ช่วงการจำหน่าย -ประเภทที่ง่ายที่สุดของการจัดกลุ่มโครงสร้างตามแอตทริบิวต์เดียว แสดงในตารางกลุ่มที่มีสองคอลัมน์ที่มีตัวแปรและความถี่ของแอตทริบิวต์ ในหลายกรณีด้วยการจัดกลุ่มโครงสร้างเช่น ด้วยการรวบรวมชุดการแจกจ่าย การศึกษาข้อมูลทางสถิติเบื้องต้นเริ่มต้นขึ้น

การจัดกลุ่มโครงสร้างในรูปแบบของชุดการแจกจ่ายสามารถเปลี่ยนเป็นการจัดกลุ่มโครงสร้างที่แท้จริงได้ หากกลุ่มที่เลือกมีลักษณะเฉพาะไม่เฉพาะตามความถี่เท่านั้น แต่ยังรวมถึงตัวบ่งชี้ทางสถิติอื่นๆ ด้วย จุดประสงค์หลักของชุดการแจกจ่ายคือเพื่อศึกษาความผันแปรของคุณลักษณะต่างๆ ทฤษฎีอนุกรมการแจกแจงได้รับการพัฒนาอย่างละเอียดโดยสถิติทางคณิตศาสตร์

ชุดการจัดจำหน่ายแบ่งออกเป็น แอตทริบิวต์(จัดกลุ่มตามลักษณะเฉพาะตัว เช่น การแบ่งกลุ่มประชากรตามเพศ สัญชาติ สถานภาพสมรส เป็นต้น) และ ผันแปร(จัดกลุ่มตามลักษณะเชิงปริมาณ)

ชุดตัวแปรเป็นตารางกลุ่มที่มีสองคอลัมน์: การจัดกลุ่มของหน่วยตามแอตทริบิวต์เชิงปริมาณหนึ่งรายการและจำนวนหน่วยในแต่ละกลุ่ม ช่วงเวลาในอนุกรมความแปรผันมักจะเกิดขึ้นเท่ากันและปิด ซีรีส์รูปแบบต่างๆคือกลุ่มต่อไปของประชากรรัสเซียในแง่ของรายได้เงินสดต่อหัว (ตารางที่ 3.10)

ตาราง 3.10

การกระจายตัวของประชากรรัสเซียตามรายได้เฉลี่ยต่อหัวในปี 2547-2552

กลุ่มประชากรตามรายได้เงินสดเฉลี่ยต่อหัว rub./เดือน

ประชากรในกลุ่มคิดเป็น % ของทั้งหมด

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

มากกว่า 25,000.0

ประชากรทั้งหมด

ในทางกลับกัน อนุกรมแบบแปรผันจะแบ่งออกเป็นแบบไม่ต่อเนื่องและแบบช่วง ไม่ต่อเนื่องซีรีส์รูปแบบต่างๆ ผสมผสานรูปแบบต่างๆ ของคุณลักษณะที่ไม่ต่อเนื่องซึ่งแตกต่างกันภายในขอบเขตที่แคบ ตัวอย่างของชุดรูปแบบที่ไม่ต่อเนื่องคือการกระจายครอบครัวรัสเซียตามจำนวนเด็กที่พวกเขามี

ช่วงเวลาซีรีส์ Variational Series ผสมผสานรูปแบบต่างๆ ของคุณลักษณะที่ต่อเนื่องกันหรือคุณลักษณะที่ไม่ต่อเนื่องซึ่งเปลี่ยนแปลงไปในวงกว้าง อนุกรมช่วงเวลาคือชุดที่แปรผันของการกระจายตัวของประชากรรัสเซียในแง่ของรายได้เงินสดเฉลี่ยต่อหัว

ในทางปฏิบัติไม่ได้ใช้อนุกรมวิธานแบบแยกส่วนบ่อยนัก ในขณะเดียวกัน การรวบรวมพวกมันก็ไม่ใช่เรื่องยาก เนื่องจากองค์ประกอบของกลุ่มถูกกำหนดโดยตัวแปรเฉพาะที่ลักษณะการจัดกลุ่มที่ศึกษามีอยู่จริง

อนุกรมวิธานแบบช่วงเวลาจะแพร่หลายมากขึ้น ในการรวบรวมคำถามที่ยากเกิดขึ้นจากจำนวนกลุ่มตลอดจนขนาดของช่วงเวลาที่ควรกำหนด

หลักการในการแก้ไขปัญหานี้มีระบุไว้ในบทเกี่ยวกับวิธีการสร้างการจัดกลุ่มทางสถิติ (ดูย่อหน้าที่ 3.3)

ชุดความแปรปรวนเป็นวิธีการยุบหรือบีบอัดข้อมูลที่หลากหลายให้อยู่ในรูปแบบกะทัดรัด สามารถใช้เพื่อสร้างการตัดสินใจที่ชัดเจนพอสมควรเกี่ยวกับธรรมชาติของการแปรผัน เพื่อศึกษาความแตกต่างในสัญญาณของปรากฏการณ์ที่รวมอยู่ในฉากที่กำลังศึกษา แต่ความสำคัญที่สำคัญที่สุดของอนุกรมความแปรผันคือโดยพื้นฐานแล้ว ลักษณะทั่วไปพิเศษของการแปรผันจะถูกคำนวณ (ดูบทที่ 7)

ผันแปรเรียกว่าชุดการแจกจ่ายที่สร้างขึ้นบนพื้นฐานเชิงปริมาณ ค่าของลักษณะเชิงปริมาณในแต่ละหน่วยของประชากรไม่คงที่ แตกต่างกันมากหรือน้อย

Variation- ความผันผวนความแปรปรวนของค่าแอตทริบิวต์ในหน่วยของประชากร แยก ค่าตัวเลขลักษณะที่เกิดขึ้นในกลุ่มประชากรที่ศึกษาเรียกว่า ตัวเลือกค่า ความไม่เพียงพอของค่าเฉลี่ยสำหรับการกำหนดลักษณะที่สมบูรณ์ของประชากรทำให้จำเป็นต้องเสริมค่าเฉลี่ยด้วยตัวบ่งชี้ที่ทำให้สามารถประเมินลักษณะทั่วไปของค่าเฉลี่ยเหล่านี้ได้โดยการวัดความผันผวน (การเปลี่ยนแปลง) ของลักษณะภายใต้การศึกษา

การปรากฏตัวของการเปลี่ยนแปลงนั้นเกิดจากอิทธิพลของปัจจัยจำนวนมากต่อการก่อตัวของระดับลักษณะ ปัจจัยเหล่านี้กระทำการด้วยแรงที่ไม่เท่ากันและในทิศทางที่ต่างกัน ตัวบ่งชี้การเปลี่ยนแปลงใช้เพื่ออธิบายการวัดความแปรปรวนของลักษณะ

งานของการศึกษาทางสถิติของการแปรผัน:

  • 1) การศึกษาธรรมชาติและระดับความแปรปรวนของสัญญาณในแต่ละหน่วยของประชากร
  • 2) การกำหนดบทบาทของปัจจัยส่วนบุคคลหรือกลุ่มของพวกเขาในการเปลี่ยนแปลงของคุณลักษณะบางอย่างของประชากร

ในสถิติจะใช้วิธีการพิเศษในการศึกษาความแปรผันตามการใช้ระบบตัวบ่งชี้ กับโดยที่ความแปรปรวนจะถูกวัด

การศึกษาความผันแปรเป็นสิ่งสำคัญ การวัดความแปรปรวนเป็นสิ่งจำเป็นเมื่อทำการสังเกตตัวอย่าง การวิเคราะห์สหสัมพันธ์และการวิเคราะห์ความแปรปรวน ฯลฯ Ermolaev O.Yu. สถิติทางคณิตศาสตร์สำหรับนักจิตวิทยา: ตำรา [ข้อความ] / O.Yu. เออร์โมเลฟ - M .: Flint Publishing House ของสถาบันจิตวิทยาและสังคมมอสโก 2555 - 335p

ตามระดับของการเปลี่ยนแปลง เราสามารถตัดสินความเป็นเนื้อเดียวกันของประชากร ความเสถียรของค่าคุณลักษณะส่วนบุคคล และลักษณะทั่วไปของค่าเฉลี่ย บนพื้นฐานของตัวบ่งชี้ความใกล้ชิดของความสัมพันธ์ระหว่างสัญญาณตัวบ่งชี้สำหรับการประเมินความถูกต้องของการสังเกตแบบคัดเลือกได้รับการพัฒนา

มีการเปลี่ยนแปลงในอวกาศและการเปลี่ยนแปลงในเวลา

ความแปรปรวนในอวกาศเป็นที่เข้าใจกันว่าความผันผวนของค่าคุณลักษณะในหน่วยของประชากรที่เป็นตัวแทนของอาณาเขตที่แยกจากกัน ภายใต้การเปลี่ยนแปลงของเวลาหมายถึงการเปลี่ยนแปลงในค่าของแอตทริบิวต์ในช่วงเวลาต่างๆ

เพื่อศึกษาความแปรผันในอนุกรมการแจกแจง ตัวแปรทั้งหมดของค่าแอตทริบิวต์จะเรียงลำดับจากน้อยไปมากหรือมากไปหาน้อย กระบวนการนี้เรียกว่าการจัดอันดับซีรีส์

สัญญาณการเปลี่ยนแปลงที่ง่ายที่สุดคือ ต่ำสุดและสูงสุด- ค่าที่เล็กที่สุดและใหญ่ที่สุดของแอตทริบิวต์ในผลรวม จำนวนการทำซ้ำของค่าคุณลักษณะแต่ละตัวแปรเรียกว่าความถี่ของการทำซ้ำ (fi) สะดวกในการเปลี่ยนความถี่ด้วยความถี่ - wi ความถี่ - ตัวบ่งชี้ความถี่สัมพัทธ์ ซึ่งสามารถแสดงเป็นเศษส่วนของหน่วยหรือเปอร์เซ็นต์ และช่วยให้คุณสามารถเปรียบเทียบชุดรูปแบบต่างๆ กับจำนวนการสังเกตที่ต่างกันได้ แสดงโดยสูตร:

โดยที่ Xmax, Xmin - ค่าสูงสุดและต่ำสุดของแอตทริบิวต์โดยรวม n คือจำนวนกลุ่ม

ในการวัดความผันแปรของคุณลักษณะ จะใช้ตัวบ่งชี้แบบสัมบูรณ์และแบบสัมพัทธ์ต่างๆ ตัวชี้วัดความผันแปรแบบสัมบูรณ์รวมถึงช่วงของการเปลี่ยนแปลง ความเบี่ยงเบนเชิงเส้นเฉลี่ย ความแปรปรวน ส่วนเบี่ยงเบนมาตรฐาน ตัวบ่งชี้สัมพัทธ์ของความผันผวนประกอบด้วยค่าสัมประสิทธิ์การสั่น ส่วนเบี่ยงเบนเชิงเส้นสัมพัทธ์ ค่าสัมประสิทธิ์การแปรผัน

ตัวอย่างการหาชุดตัวแปร

ออกกำลังกาย.สำหรับตัวอย่างนี้:

  • ก) ค้นหาชุดการเปลี่ยนแปลง
  • b) สร้างฟังก์ชันการกระจาย

เลขที่=42. รายการตัวอย่าง:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

วิธีการแก้.

  • ก) การสร้างชุดตัวแปรที่จัดอันดับ:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) การสร้างชุดตัวแปรแบบแยกส่วน

มาคำนวณจำนวนกลุ่มในชุดตัวแปรโดยใช้สูตร Sturgess:

ลองหาจำนวนกลุ่มที่เท่ากับ 7

เมื่อทราบจำนวนกลุ่มเราคำนวณค่าของช่วงเวลา:

เพื่อความสะดวกในการสร้างตารางเราจะเอาจำนวนกลุ่มเท่ากับ 8 ช่วงจะเป็น 1

ข้าว. หนึ่ง ปริมาณการขายสินค้าโดยร้านค้าในช่วงระยะเวลาหนึ่ง

แถวที่สร้าง ตามปริมาณเรียกว่า ผันแปร.

ชุดการจัดจำหน่ายประกอบด้วย ตัวเลือก(ค่าลักษณะเฉพาะ) และ ความถี่(จำนวนกลุ่ม). ความถี่ที่แสดงเป็นค่าสัมพัทธ์ (ส่วนแบ่ง, เปอร์เซ็นต์) เรียกว่า ความถี่. ผลรวมของความถี่ทั้งหมดเรียกว่าปริมาตรของอนุกรมการแจกแจง

ตามประเภท ชุดการแจกจ่ายจะแบ่งออกเป็น ไม่ต่อเนื่อง(สร้างขึ้นจากค่าที่ไม่ต่อเนื่องของคุณสมบัติ) และ ช่วงเวลา(สร้างขึ้นจากค่าคุณสมบัติต่อเนื่อง)

ชุดตัวแปรหมายถึงสองคอลัมน์ (หรือแถว); หนึ่งในนั้นให้ค่าแต่ละค่าของแอตทริบิวต์ตัวแปรที่เรียกว่าตัวแปรและแสดงโดย X; และอีกนัยหนึ่ง - ตัวเลขสัมบูรณ์แสดงจำนวนครั้งที่แต่ละตัวเลือกเกิดขึ้น (บ่อยแค่ไหน) ตัวบ่งชี้ของคอลัมน์ที่สองเรียกว่าความถี่และแสดงด้วย f ตามอัตภาพ เราทราบอีกครั้งว่าในคอลัมน์ที่สอง ตัวบ่งชี้สัมพัทธ์ที่แสดงลักษณะส่วนแบ่งของความถี่ของตัวแปรแต่ละตัวในจำนวนความถี่ทั้งหมดก็สามารถใช้ได้เช่นกัน ตัวบ่งชี้สัมพัทธ์เหล่านี้เรียกว่าความถี่และแสดงตามอัตภาพโดย ω ผลรวมของความถี่ทั้งหมดในกรณีนี้จะเท่ากับหนึ่ง อย่างไรก็ตาม ความถี่ยังสามารถแสดงเป็นเปอร์เซ็นต์ จากนั้นผลรวมของความถี่ทั้งหมดจะให้ 100%

หากตัวแปรของอนุกรมผันแปรแสดงเป็น ปริมาณที่ไม่ต่อเนื่องจากนั้นจึงเรียกอนุกรมวิธานดังกล่าวว่า ไม่ต่อเนื่อง

สำหรับคุณสมบัติต่อเนื่อง ซีรีย์รูปแบบต่างๆ จะถูกสร้างเป็น ช่วงเวลานั่นคือค่าของแอตทริบิวต์ในนั้นแสดง "จาก ... ถึง ... " ในกรณีนี้ค่าต่ำสุดของแอตทริบิวต์ในช่วงเวลาดังกล่าวเรียกว่าขีด จำกัด ล่างของช่วงเวลาและค่าสูงสุด - ขีด จำกัด บน

นอกจากนี้ ซีรีย์ Interval Variational ยังสร้างขึ้นสำหรับคุณสมบัติที่ไม่ต่อเนื่องซึ่งแตกต่างกันไปตามช่วงกว้าง อนุกรมช่วงเวลาสามารถเป็น เท่ากันและ ไม่เท่ากันช่วงเวลา

พิจารณาวิธีการหาค่าของช่วงที่เท่ากัน ให้เราแนะนำสัญกรณ์ต่อไปนี้:

ผม– ค่าช่วง;

- ค่าสูงสุดของแอตทริบิวต์สำหรับหน่วยของประชากร

- ค่าต่ำสุดของแอตทริบิวต์สำหรับหน่วยของประชากร

น-จำนวนกลุ่มที่ได้รับการจัดสรร

ถ้า n เป็นที่รู้จัก

หากจำนวนกลุ่มที่ได้รับการจัดสรรนั้นยากต่อการกำหนดล่วงหน้า ขอแนะนำให้ใช้สูตรที่เสนอโดย Sturgess ในปี 1926 เพื่อคำนวณขนาดที่เหมาะสมที่สุดของช่วงเวลาด้วยขนาดประชากรที่เพียงพอ:

n = 1+ 3.322 log N โดยที่ N คือจำนวนประชากรในประชากร

ค่าของช่วงที่ไม่เท่ากันจะถูกกำหนดในแต่ละกรณี โดยคำนึงถึงลักษณะของวัตถุที่ศึกษา

การกระจายทางสถิติของกลุ่มตัวอย่างเรียกรายการตัวเลือกและความถี่ที่เกี่ยวข้อง (หรือความถี่สัมพัทธ์)

การกระจายทางสถิติของกลุ่มตัวอย่างสามารถระบุได้ในรูปแบบของตาราง ในคอลัมน์แรกซึ่งมีตัวเลือก และในคอลัมน์ที่สอง - ความถี่ที่สอดคล้องกับตัวเลือกเหล่านี้ นิหรือความถี่สัมพัทธ์ ปี่ .

การกระจายทางสถิติของกลุ่มตัวอย่าง

อนุกรมช่วงเวลาเรียกว่า อนุกรมความแปรผัน ซึ่งค่าของคุณสมบัติที่อยู่ภายใต้การก่อตัวของพวกมันจะแสดงภายในขอบเขตที่แน่นอน (ช่วงเวลา) ความถี่ในกรณีนี้ไม่ได้หมายถึงค่าแต่ละค่าของแอตทริบิวต์ แต่หมายถึงช่วงทั้งหมด

อนุกรมการแจกแจงแบบช่วงเวลาถูกสร้างขึ้นตามลักษณะเชิงปริมาณอย่างต่อเนื่อง เช่นเดียวกับลักษณะเฉพาะที่ไม่ต่อเนื่อง ซึ่งแตกต่างกันภายในช่วงที่มีนัยสำคัญ

อนุกรมช่วงเวลาสามารถแสดงได้ด้วยการแจกแจงทางสถิติของตัวอย่าง โดยระบุช่วงเวลาและความถี่ที่สอดคล้องกัน ในกรณีนี้ ผลรวมของความถี่ของตัวแปรที่อยู่ในช่วงนี้จะถูกนำมาเป็นความถี่ของช่วงเวลา

เมื่อจัดกลุ่มตามคุณลักษณะต่อเนื่องเชิงปริมาณ การกำหนดขนาดของช่วงเวลาเป็นสิ่งสำคัญ

นอกจากค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างแล้ว ยังใช้คุณลักษณะอื่นๆ ของชุดการแปรผันด้วย

แฟชั่นตั้งชื่อตัวแปรที่มีความถี่สูงสุด

อนุกรมการแจกแจงทางสถิติ- นี่คือการกระจายตามลำดับของหน่วยประชากรออกเป็นกลุ่มตามคุณลักษณะที่แตกต่างกัน
ขึ้นอยู่กับลักษณะที่อยู่ภายใต้การก่อตัวของอนุกรมการแจกแจงมี แอตทริบิวต์และชุดการกระจายรูปแบบ.

การมีอยู่ของคุณลักษณะทั่วไปเป็นพื้นฐานสำหรับการก่อตัวของประชากรทางสถิติ ซึ่งเป็นผลมาจากคำอธิบายหรือการวัดลักษณะทั่วไปของวัตถุที่ศึกษา

วิชาที่ศึกษาทางสถิติมีการเปลี่ยนแปลง (ต่างกัน) ลักษณะหรือลักษณะทางสถิติ

ประเภทของคุณสมบัติทางสถิติ.

ชุดการแจกจ่ายเรียกว่าชุดคุณลักษณะสร้างขึ้นบนพื้นฐานคุณภาพ แอตทริบิวต์- นี่คือสัญญาณที่มีชื่อ (เช่น อาชีพ: ช่างเย็บผ้า ครู ฯลฯ )
เป็นเรื่องปกติที่จะจัดเรียงชุดการแจกจ่ายในรูปแบบของตาราง ในตาราง. 2.8 แสดงชุดแอตทริบิวต์ของการกระจาย
ตารางที่ 2.8 - การแจกจ่ายประเภทของความช่วยเหลือทางกฎหมายที่ทนายความมอบให้กับพลเมืองในภูมิภาคใดภูมิภาคหนึ่งของสหพันธรัฐรัสเซีย

ชุดตัวแปรคือค่าคุณลักษณะ (หรือช่วงของค่า) และความถี่
ชุดตัวแปรคือชุดการกระจายสร้างขึ้นบนพื้นฐานเชิงปริมาณ ชุดตัวแปรใด ๆ ประกอบด้วยสององค์ประกอบ: ตัวแปรและความถี่
ตัวแปรคือค่าแต่ละค่าของคุณลักษณะที่ใช้ในชุดรูปแบบต่างๆ
ความถี่คือตัวเลขของตัวแปรแต่ละตัวหรือแต่ละกลุ่มของชุดรูปแบบการแปรผัน กล่าวคือ ตัวเลขเหล่านี้เป็นตัวเลขที่แสดงว่าตัวเลือกบางอย่างเกิดขึ้นในชุดการแจกจ่ายบ่อยเพียงใด ผลรวมของความถี่ทั้งหมดกำหนดขนาดของประชากรทั้งหมด ปริมาตรของมัน
ความถี่เรียกว่าความถี่ซึ่งแสดงเป็นเศษส่วนของหน่วยหรือเป็นเปอร์เซ็นต์ของผลรวม ดังนั้น ผลรวมของความถี่จะเท่ากับ 1 หรือ 100% อนุกรมความแปรปรวนช่วยให้เราสามารถประเมินรูปแบบของกฎหมายการจัดจำหน่ายโดยพิจารณาจากข้อมูลจริง

ขึ้นอยู่กับลักษณะของความผันแปรของลักษณะมี อนุกรมความแปรผันแบบไม่ต่อเนื่องและตามช่วงเวลา.
ตัวอย่างของชุดตัวแปรแบบแยกส่วนแสดงไว้ในตาราง 2.9.
ตารางที่ 2.9 - การกระจายของครอบครัวตามจำนวนห้องที่ถูกครอบครองในอพาร์ตเมนต์แต่ละห้องในปี 1989 ในสหพันธรัฐรัสเซีย

คอลัมน์แรกของตารางแสดงชุดตัวแปรแบบแยกส่วน คอลัมน์ที่สองประกอบด้วยความถี่ของชุดตัวแปรแบบแปรผัน และคอลัมน์ที่สามมีตัวระบุความถี่

ชุดตัวแปร

ในประชากรทั่วไป กำลังตรวจสอบลักษณะเชิงปริมาณบางอย่าง สุ่มตัวอย่างปริมาตรจากมัน นั่นคือจำนวนองค์ประกอบในตัวอย่างคือ . ในขั้นตอนแรกของการประมวลผลทางสถิติ หลากหลายตัวอย่าง เช่น การสั่งซื้อหมายเลข x 1 , x 2 , …, x นจากน้อยไปมาก. แต่ละค่าที่สังเกตได้ x ฉันเรียกว่า ตัวเลือก. ความถี่ ฉันคือจำนวนการสังเกตของค่า x ฉันในตัวอย่าง ความถี่สัมพัทธ์ (ความถี่) ฉันคืออัตราส่วนความถี่ ฉันขนาดตัวอย่าง : .
เมื่อศึกษาอนุกรมความแปรผัน แนวคิดของความถี่สะสมและความถี่สะสมก็ถูกนำมาใช้เช่นกัน อนุญาต xตัวเลขบางส่วน จากนั้นจำนวนตัวเลือก , ที่มีค่าน้อยกว่า xเรียกว่าความถี่สะสม สำหรับ x i นเรียกว่า ความถี่สะสม w i max
คุณลักษณะเรียกว่าตัวแปรแบบไม่ต่อเนื่องหากค่าแต่ละค่า (ตัวแปร) แตกต่างกันตามจำนวนที่ จำกัด (โดยปกติเป็นจำนวนเต็ม) อนุกรมผันแปรของคุณลักษณะดังกล่าวเรียกว่าชุดแปรผันที่ไม่ต่อเนื่อง

ตารางที่ 1. มุมมองทั่วไปของชุดความถี่แบบแปรผันที่ไม่ต่อเนื่อง

ค่าคุณสมบัติx ฉัน x 1 x2 x น
ความถี่ฉัน ม.1 m2 ม น

คุณลักษณะจะเรียกว่าแปรผันอย่างต่อเนื่องหากค่าของมันแตกต่างกันในปริมาณเล็กน้อยโดยพลการเช่น เครื่องหมายสามารถรับค่าใดก็ได้ในช่วงเวลาหนึ่ง อนุกรมความแปรผันต่อเนื่องสำหรับคุณลักษณะดังกล่าวเรียกว่า อนุกรมช่วงเวลา

ตารางที่ 2. มุมมองทั่วไปของชุดความถี่ที่แปรผันตามช่วงเวลา

ตารางที่ 3 ภาพกราฟิกของชุดรูปแบบต่างๆ

แถวรูปหลายเหลี่ยมหรือฮิสโตแกรมฟังก์ชันการกระจายเชิงประจักษ์
ไม่ต่อเนื่อง
ช่วงเวลา
เมื่อพิจารณาจากผลการสังเกต จะกำหนดจำนวนตัวแปรที่ตกลงไปในแต่ละช่วงที่กำหนด สันนิษฐานว่าแต่ละช่วงเวลาเป็นของปลายด้านใดด้านหนึ่ง: ในทุกกรณีทางด้านซ้าย (บ่อยกว่า) หรือในทุกกรณีทางด้านขวา และความถี่หรือความถี่แสดงจำนวนตัวเลือกที่มีอยู่ในขอบเขตที่ระบุ ความแตกต่าง ฉัน – ฉัน +1เรียกว่าช่วงบางส่วน เพื่อทำให้การคำนวณในภายหลังง่ายขึ้น สามารถแทนที่ชุดรูปแบบช่วงเวลาด้วยชุดข้อมูลแบบไม่ต่อเนื่องแบบมีเงื่อนไข ในกรณีนี้ ค่ากลาง ผม-ช่วงที่ถือเป็นตัวเลือก x ฉันและความถี่ช่วงที่สอดคล้องกัน ฉัน- สำหรับความถี่ของช่วงนี้
สำหรับการแสดงกราฟิกของอนุกรมแบบแปรผัน มักใช้รูปหลายเหลี่ยม ฮิสโตแกรม เส้นโค้งสะสม และฟังก์ชันการกระจายเชิงประจักษ์

ในตาราง. 2.3 (การจัดกลุ่มประชากรของรัสเซียตามขนาดของรายได้เฉลี่ยต่อหัวในเดือนเมษายน 1994) นำเสนอ อนุกรมความผันแปรตามช่วงเวลา.
สะดวกในการวิเคราะห์ชุดการแจกจ่ายโดยใช้การแสดงแบบกราฟิก ซึ่งทำให้สามารถตัดสินรูปร่างของการแจกแจงได้ การแสดงภาพของธรรมชาติของการเปลี่ยนแปลงในความถี่ของอนุกรมผันแปรได้มาจาก รูปหลายเหลี่ยมและฮิสโตแกรม.
ใช้รูปหลายเหลี่ยมเมื่อแสดงอนุกรมที่แปรผันไม่ต่อเนื่อง.
ให้เราอธิบายตัวอย่างเช่นการแจกแจงหุ้นที่อยู่อาศัยตามประเภทของอพาร์ทเมนท์ (ตารางที่ 2.10) แบบกราฟิก
ตารางที่ 2.10 - การกระจายสต็อกที่อยู่อาศัยในเขตเมืองตามประเภทของอพาร์ทเมนท์ (ตัวเลขตามเงื่อนไข)


ข้าว. รูปหลายเหลี่ยมการกระจายที่อยู่อาศัย


บนแกน y ไม่เพียงแต่สามารถพล็อตค่าของความถี่เท่านั้น แต่ยังสามารถพล็อตความถี่ของอนุกรมรูปแบบต่างๆ ได้อีกด้วย
ฮิสโตแกรมถูกนำมาใช้เพื่อแสดงชุดรูปแบบช่วงเวลา. เมื่อสร้างฮิสโตแกรม ค่าของช่วงเวลาจะถูกพล็อตบนแกน abscissa และแสดงความถี่ด้วยสี่เหลี่ยมที่สร้างขึ้นในช่วงเวลาที่เกี่ยวข้อง ความสูงของคอลัมน์ในกรณีที่มีช่วงเท่ากันควรเป็นสัดส่วนกับความถี่ ฮิสโตแกรมคือกราฟที่แสดงชุดข้อมูลเป็นแท่งที่อยู่ติดกัน
มาวาดชุดการแจกแจงตามช่วงเวลาแบบกราฟิกกันในตารางกัน 2.11.
ตารางที่ 2.11 - การกระจายของครอบครัวตามขนาดพื้นที่ใช้สอยต่อคน (ตัวเลขตามเงื่อนไข)
ไม่มี p / p กลุ่มครอบครัวตามขนาดพื้นที่ใช้สอยต่อท่าน จำนวนครอบครัวที่มีขนาดพื้นที่ใช้สอยที่กำหนด จำนวนครอบครัวสะสม
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
ทั้งหมด 115 ----


ข้าว. 2.2. ฮิสโตแกรมของการกระจายของครอบครัวตามขนาดพื้นที่ใช้สอยต่อคน


โดยใช้ข้อมูลของชุดสะสม (ตาราง 2.11) เราสร้าง การกระจายสะสม


ข้าว. 2.3. การกระจายสะสมของครอบครัวตามขนาดพื้นที่ใช้สอยต่อคน


การแสดงชุดความแปรผันในรูปแบบของการสะสมมีประสิทธิภาพโดยเฉพาะอย่างยิ่งสำหรับอนุกรมผันแปร ซึ่งความถี่จะแสดงเป็นเศษส่วนหรือเปอร์เซ็นต์ของผลรวมของความถี่ของชุดข้อมูล
หากเราเปลี่ยนแกนในการแสดงกราฟิกของอนุกรมผันแปรในรูปของสะสม เราก็จะได้ ogivu. ในรูป 2.4 แสดง ogive ที่สร้างขึ้นบนพื้นฐานของข้อมูลในตาราง 2.11.
ฮิสโตแกรมสามารถแปลงเป็นรูปหลายเหลี่ยมการกระจายได้โดยการหาจุดกึ่งกลางของด้านข้างของสี่เหลี่ยมแล้วเชื่อมต่อจุดเหล่านี้ด้วยเส้นตรง รูปหลายเหลี่ยมการกระจายผลลัพธ์จะแสดงในรูปที่ 2.2 เส้นประ
เมื่อสร้างฮิสโตแกรมของการแจกแจงอนุกรมแบบแปรผันที่มีช่วงระยะไม่เท่ากัน จะไม่ใช้ความถี่ในแกนของพิกัด แต่จะใช้ความหนาแน่นของการกระจายของจุดสนใจในช่วงเวลาที่สอดคล้องกัน
ความหนาแน่นของการกระจายคือความถี่ที่คำนวณต่อความกว้างของช่วงหน่วย กล่าวคือ จำนวนหน่วยในแต่ละกลุ่มเป็นค่าช่วงต่อหน่วย ตัวอย่างการคำนวณความหนาแน่นของการกระจายแสดงในตาราง 2.12.
ตารางที่ 2.12 - การกระจายวิสาหกิจตามจำนวนพนักงาน (ตัวเลขมีเงื่อนไข)
ไม่มี p / p กลุ่มวิสาหกิจตามจำนวนพนักงานรายบุคคล จำนวนสถานประกอบการ ขนาดช่วงต่อ ความหนาแน่นของการกระจาย
แต่ 1 2 3=1/2
1 มากถึง 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
ทั้งหมด 147 ---- ----

สำหรับการแสดงกราฟิกของชุดรูปแบบต่างๆ ก็สามารถใช้ได้เช่นกัน เส้นโค้งสะสม. ด้วยความช่วยเหลือของสะสม (เส้นโค้งของผลรวม) ชุดของความถี่สะสมจะปรากฏขึ้น ความถี่สะสมถูกกำหนดโดยการสรุปความถี่ตามลำดับโดยกลุ่มและแสดงจำนวนหน่วยของประชากรที่มีค่าคุณลักษณะไม่เกินค่าที่พิจารณา


ข้าว. 2.4. Ogiva แบ่งครอบครัวตามขนาดพื้นที่ใช้สอยต่อคน

เมื่อสร้างชุดสะสมของอนุกรมความแปรผันตามช่วงเวลา ตัวแปรของชุดข้อมูลจะถูกพล็อตตามแกน abscissa และความถี่สะสมตามแกนพิกัด

ซีรีย์รูปแบบต่อเนื่อง

อนุกรมผันแปรต่อเนื่องเป็นอนุกรมที่สร้างขึ้นบนพื้นฐานของ คุณสมบัติทางสถิติเชิงปริมาณ. ตัวอย่าง. ระยะเวลาเฉลี่ยของโรคของนักโทษ (วันต่อคน) ในช่วงฤดูใบไม้ร่วงฤดูหนาวในปีปัจจุบันคือ:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5