การประมวลผลข้อมูลเชิงสถิติ การประมวลผลข้อมูลทางสถิติ คำจำกัดความของการประมวลผลข้อมูลทางสถิติ

สไลด์ 2

สถิติเป็นวิทยาศาสตร์ที่แน่นอนที่ศึกษาวิธีการรวบรวม วิเคราะห์ และประมวลผลข้อมูลที่อธิบายการกระทำ ปรากฏการณ์ และกระบวนการของมวล
สถิติทางคณิตศาสตร์เป็นสาขาหนึ่งของคณิตศาสตร์ที่ศึกษาวิธีการรวบรวม การจัดระบบ และการประมวลผลผลลัพธ์ของการสังเกตปรากฏการณ์มวลแบบสุ่ม เพื่อระบุรูปแบบที่มีอยู่

สไลด์ 3

การศึกษาสถิติ

จำนวนกลุ่มประชากรแต่ละกลุ่มของประเทศและภูมิภาค
การผลิตและการบริโภคผลิตภัณฑ์ประเภทต่างๆ
การขนส่งสินค้าและคนโดยสารด้วยการขนส่งรูปแบบต่างๆ
ทรัพยากรธรรมชาติ และอื่นๆ อีกมากมาย
ผลการศึกษาทางสถิติถูกนำมาใช้กันอย่างแพร่หลายในการสรุปเชิงปฏิบัติและเชิงวิทยาศาสตร์
ปัจจุบันเริ่มมีการศึกษาสถิติแล้วใน มัธยมในมหาวิทยาลัย นี่เป็นวิชาบังคับ เนื่องจากมีความเกี่ยวข้องกับวิทยาศาสตร์และสาขาวิชาต่างๆ มากมาย
เพื่อเพิ่มจำนวนการขายในร้านค้า เพื่อปรับปรุงคุณภาพความรู้ในโรงเรียน เพื่อขับเคลื่อนประเทศไปสู่การเติบโตทางเศรษฐกิจ จำเป็นต้องทำการศึกษาทางสถิติและหาข้อสรุปที่เหมาะสม และทุกคนควรจะสามารถทำเช่นนี้ได้

สไลด์ 4

เป้าหมายหลักของการศึกษาองค์ประกอบของสถิติ

การก่อตัวของทักษะในการประมวลผลข้อมูลทางสถิติเบื้องต้น
ภาพและการวิเคราะห์ข้อมูลเชิงปริมาณที่นำเสนอในรูปแบบต่างๆ (ในรูปของตาราง แผนภาพ กราฟของการพึ่งพาจริง)
การพัฒนาแนวคิดเกี่ยวกับแนวคิดทางสถิติที่สำคัญ ได้แก่ แนวคิดเรื่องการประมาณค่าและแนวคิดในการทดสอบสมมติฐานทางสถิติ
พัฒนาความสามารถในการเปรียบเทียบความน่าจะเป็นของเหตุการณ์สุ่มที่เกิดขึ้นกับผลการทดลองเฉพาะ

สไลด์ 5

ชุดข้อมูล
ปริมาณชุดข้อมูล
ช่วงของชุดข้อมูล
โหมดชุดข้อมูล
ค่ามัธยฐานของซีรีส์
เฉลี่ย
สั่งซื้อชุดข้อมูล
ตารางการกระจายข้อมูล
มาสรุปกัน
ชุดข้อมูลการเสนอชื่อ
ความถี่ผลลัพธ์
ความถี่เปอร์เซ็นต์
การจัดกลุ่มข้อมูล
วิธีการประมวลผลข้อมูล
มาสรุปกัน

สไลด์ 6

คำนิยาม

ชุดข้อมูลคือชุดผลลัพธ์ของการวัดบางอย่าง
ตัวอย่างเช่น:1) การวัดส่วนสูงของมนุษย์
2) การวัดน้ำหนักมนุษย์ (สัตว์)
3) ค่ามิเตอร์ (ไฟฟ้า, น้ำ, ความร้อน...)
4) ผลการแข่งขันในระยะ 100 เมตร
ฯลฯ

สไลด์ 7

ปริมาณของชุดข้อมูลคือปริมาณของข้อมูลทั้งหมด
ตัวอย่างเช่น ให้ชุดตัวเลข 1; 3; 6; -4; 0
ปริมาตรของมันจะเท่ากับ 5 ทำไม?

สไลด์ 8

ทำงานให้เสร็จ

กำหนดระดับเสียงของซีรี่ส์นี้
คำตอบ: 10

สไลด์ 9

คำนิยาม

พิสัยคือความแตกต่างระหว่างตัวเลขที่ใหญ่ที่สุดและน้อยที่สุดในชุดข้อมูล
ตัวอย่างเช่น: หากได้รับชุดตัวเลข 1; 3; 6; -4; 0; 2 ดังนั้นช่วงของชุดข้อมูลนี้จะเท่ากับ 6 (เนื่องจาก 6 - 0 = 6)

สไลด์ 10

ทำงานให้เสร็จ

ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่สอดคล้องกัน: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5
กำหนดช่วงของซีรี่ส์นี้
คำตอบ: 3

สไลด์ 11

คำนิยาม

โหมดของชุดข้อมูลคือจำนวนชุดข้อมูลที่เกิดขึ้นบ่อยที่สุดในชุดข้อมูลนี้
ชุดข้อมูลอาจมีหรือไม่มีโหมด
ดังนั้น ในชุดข้อมูล 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 แต่ละหมายเลข 47 และ 52 เกิดขึ้นสองครั้ง และตัวเลขที่เหลือน้อยกว่าสองครั้ง ในกรณีเช่นนี้ มีการตกลงกันว่าซีรีส์นี้มีสองโหมด: 47 และ 52

สไลด์ 12

ทำงานให้เสร็จ

ดังนั้นในชุดข้อมูล
47, 46, 50, 52, 47, 52, 49, 45, 43, 53 แต่ละหมายเลขของ 47 และ 52 ปรากฏขึ้นสองครั้ง และหมายเลขที่เหลือน้อยกว่าสองครั้ง ในกรณีเช่นนี้ มีการตกลงกันว่าซีรีส์นี้มีสองโหมด: 47 และ 52
ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่เหมาะสม:
3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
กำหนดโหมดของซีรีย์นี้
คำตอบ: 4

สไลด์ 13

คำนิยาม

ค่ามัธยฐานที่มีพจน์เป็นเลขคี่คือตัวเลขที่เขียนไว้ตรงกลาง
ค่ามัธยฐานที่มีพจน์เป็นจำนวนคู่คือค่าเฉลี่ยเลขคณิตของตัวเลขสองตัวที่เขียนไว้ตรงกลาง
ตัวอย่างเช่น กำหนดค่ามัธยฐานของชุดตัวเลข
16; -4; 5; -2; -3; 3; 3; -2; 3. คำตอบ: -3
2) -1; 0; 2; 1; -1; 0;2; -1. คำตอบ: 0

สไลด์ 14

ทำงานให้เสร็จ

ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่สอดคล้องกัน: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5
กำหนดค่ามัธยฐานของซีรี่ส์นี้
คำตอบ: 4

สไลด์ 15

คำนิยาม

ค่าเฉลี่ยเลขคณิตคือผลหารของการหารผลรวมของตัวเลขในชุดข้อมูลด้วยตัวเลข
ตัวอย่างเช่น ให้ชุดตัวเลข -1; 0; 2; 1; -1; 0; 2; -1. จากนั้นค่าเฉลี่ยเลขคณิตจะเท่ากับ: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0.25

สไลด์ 16

ทำงานให้เสร็จ

ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่สอดคล้องกัน: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5
หาค่าเฉลี่ยเลขคณิตของอนุกรมนี้
คำตอบ: 3.9

สไลด์ 17

การปฏิบัติงาน

การมอบหมาย: อธิบายลักษณะผลงานของนักเรียน Ivanov ในวิชาคณิตศาสตร์สำหรับไตรมาสที่สี่
เสร็จสิ้นการทำงาน:
1.การรวบรวมข้อมูล:
เกรดที่เขียนจากนิตยสารคือ: 5,4,5,3,3,5,4,4,4
2.การประมวลผลข้อมูลที่ได้รับ:
ปริมาณ = 9
ช่วง = 5 - 3 = 2
แฟชั่น = 4
ค่ามัธยฐาน = 3
ค่าเฉลี่ยเลขคณิต =(5+4+5+3+3+5+4+4+4) : 9 กลับไปยัง 4
ลักษณะของผลการเรียน: นักเรียนไม่พร้อมสำหรับบทเรียนเสมอไป
ส่วนใหญ่เขาเรียนด้วยเกรด "4" หนึ่งในสี่ออกมาเป็น "4"

สไลด์ 18

ด้วยตัวเอง

เราจำเป็นต้องค้นหาปริมาตรของอนุกรม ช่วงของอนุกรม โหมด ค่ามัธยฐาน และค่าเฉลี่ยเลขคณิต:
การ์ด 1. 22.5; 23; 21.5; 22; 23.
การ์ด 2.6; -4; 5; -2; -3; 3; 3; -2; 3.
ใบที่ 3 12.5; 12; 12; 12.5; 13; 12.5; 13.
การ์ด 4. -1; 0; 2; 1; -1; 0; 2; -1.
การ์ด 5. 125; 130; 124; 131.
การ์ด 6. 120; 100; 110.

สไลด์ 19

มาตรวจสอบกัน

การ์ด 1.
ปริมาณแถว = 5
ช่วงของแถว = 10
แฟชั่น = 23
มัธยฐาน = 21.5
ค่าเฉลี่ยเลขคณิต = 13.3
การ์ด 3.
ปริมาณแถว = 7
ช่วงของอนุกรม = 1
โหมด = 12.5
มัธยฐาน = 12.5
ค่าเฉลี่ยเลขคณิต = 12.5
การ์ด 2.
ปริมาณแถว = 9
ช่วงของแถว = 10
แฟชั่น = 3
ค่ามัธยฐาน = -3
ค่าเฉลี่ยเลขคณิต = 1
การ์ด 4.
ปริมาณแถว = 8
ช่วงของแถว = 3
โหมด = -1
ค่ามัธยฐาน = 0
ค่าเฉลี่ยเลขคณิต = 0.25

สไลด์ 20

การ์ด 5.
ปริมาณแถว = 4
ช่วงแถว = 7
แฟชั่น = ไม่
มัธยฐาน = 127
ค่าเฉลี่ยเลขคณิต = 127.5
การ์ด 6.
ปริมาณแถว = 3
ช่วงช่วง = 20
แฟชั่น = ไม่
มัธยฐาน = 100
ค่าเฉลี่ยเลขคณิต = 110

สไลด์ 21

คำนิยาม

ชุดข้อมูลที่เรียงลำดับคือชุดข้อมูลที่มีการจัดเรียงตามกฎบางอย่าง
จะจัดเรียงชุดตัวเลขได้อย่างไร? (เขียนตัวเลขให้แต่ละตัวเลขต่อมาไม่น้อย (ไม่มาก) กว่าตัวเลขก่อนหน้า) หรือเขียนชื่อบางชื่อ "ตามลำดับตัวอักษร"...

สไลด์ 22

ทำงานให้เสร็จ

รับชุดตัวเลข:
-1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1
เรียงตามลำดับเลขจากน้อยไปมาก
สารละลาย:
-3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3
ผลลัพธ์ที่ได้คือซีรีย์ที่สั่ง ข้อมูลเองไม่ได้เปลี่ยนแปลง มีเพียงลำดับที่ปรากฏเท่านั้นที่เปลี่ยนแปลง

สไลด์ 23

คำนิยาม

ตารางการกระจายข้อมูลคือตารางของอนุกรมที่เรียงลำดับซึ่งแทนที่จะทำซ้ำตัวเลขเดียวกัน ระบบจะบันทึกจำนวนการซ้ำ
ในทางกลับกัน หากทราบตารางการแจกจ่าย ก็จะสามารถรวบรวมข้อมูลตามลำดับได้
ตัวอย่างเช่น:
จากนั้นเราจะได้ซีรีย์ที่สั่งดังต่อไปนี้:
-3;-3;-3;-1;-1;-1;-1;5;5;7;8;8;8;8;8

สไลด์ 24

ทำงานให้เสร็จ

ในร้านขายรองเท้าสตรีแห่งหนึ่ง มีการวิจัยทางสถิติและรวบรวมตารางที่เกี่ยวข้องสำหรับราคารองเท้าและจำนวนยอดขาย:
ราคา (ถู): 500 1200 1500 1800 2000 2500
จำนวน: 8 9 14 15 3 1
สำหรับตัวบ่งชี้เหล่านี้ คุณจะต้องค้นหาคุณลักษณะทางสถิติ:
สร้างชุดข้อมูลตามลำดับ
ปริมาณของชุดข้อมูล
ช่วงซีรีส์
ชุดแฟชั่น
ค่ามัธยฐานของซีรีส์
ค่าเฉลี่ยเลขคณิตของชุดข้อมูล

สไลด์ 25

และตอบคำถามต่อไปนี้

จากหมวดราคาเหล่านี้ ร้านค้าไม่ควรขายรองเท้าที่ราคาใด
รองเท้าควรแบ่งราคาเท่าไหร่?
คุณควรตั้งเป้าหมายราคาเท่าไร?

สไลด์ 26

มาสรุปกัน

เราคุ้นเคยกับแนวคิดเบื้องต้นว่าการประมวลผลข้อมูลทางสถิติเกิดขึ้นได้อย่างไร:
ข้อมูลมักเป็นผลมาจากการวัดบางอย่างเสมอ
ข้อมูลบางส่วนสามารถพบได้:
ระดับเสียง ช่วง โหมด ค่ามัธยฐาน และ
เฉลี่ย
3) ชุดข้อมูลใดก็ได้
จัดระเบียบและเขียน
ตารางการกระจายข้อมูล

สไลด์ 27

คำนิยาม

ชุดข้อมูลที่ระบุชื่อไม่ใช่ข้อมูลเชิงตัวเลข แต่เช่น ชื่อ ชื่อ; การเสนอชื่อ...
ตัวอย่างเช่น: รายชื่อผู้เข้ารอบสุดท้ายของฟุตบอลโลกตั้งแต่ปี 1930: อาร์เจนตินา, เชโกสโลวาเกีย, ฮังการี, บราซิล, ฮังการี, สวีเดน, เชโกสโลวะเกีย, เยอรมนี, อิตาลี, เนเธอร์แลนด์, เนเธอร์แลนด์, เยอรมนี, เยอรมนี,
อาร์เจนตินา อิตาลี บราซิล เยอรมนี ฝรั่งเศส

สไลด์ 28

ทำงานให้เสร็จ

ค้นหาจากตัวอย่างก่อนหน้า:
ปริมาณของแถวที่ 2) โหมดของแถว
3) สร้างตารางการแจกจ่าย
วิธีแก้ไข: ปริมาตร = 18; แฟชั่น – ทีมเยอรมัน.

งานห้องปฏิบัติการหมายเลข 3 การประมวลผลข้อมูลทางสถิติในระบบ MatLab

คำแถลงทั่วไปของปัญหา

วัตถุประสงค์หลักของการดำเนินการ งานห้องปฏิบัติการคือการทำความคุ้นเคยกับพื้นฐานของการทำงานกับการประมวลผลข้อมูลทางสถิติในสภาพแวดล้อม MatLAB

ส่วนทางทฤษฎี

การประมวลผลข้อมูลทางสถิติเบื้องต้น

การประมวลผลข้อมูลทางสถิติขึ้นอยู่กับวิธีเชิงปริมาณหลักและรอง วัตถุประสงค์ของการประมวลผลข้อมูลทางสถิติเบื้องต้นคือเพื่อจัดโครงสร้างข้อมูลที่ได้รับ ซึ่งเกี่ยวข้องกับการจัดกลุ่มข้อมูลลงในตารางสรุปตามพารามิเตอร์ต่างๆ ข้อมูลปฐมภูมิจะต้องนำเสนอในรูปแบบที่ช่วยให้บุคคลสามารถประเมินชุดข้อมูลที่ได้โดยประมาณ และเพื่อระบุข้อมูลเกี่ยวกับการกระจายข้อมูลของตัวอย่างข้อมูลที่เป็นผล เช่น ความสม่ำเสมอหรือความกะทัดรัดของข้อมูล หลังจากการวิเคราะห์ข้อมูลหลักแล้ว จะใช้วิธีการประมวลผลข้อมูลทางสถิติรอง โดยพิจารณาจากรูปแบบทางสถิติในชุดข้อมูลที่มีอยู่

การดำเนินการวิเคราะห์ทางสถิติเบื้องต้นในอาร์เรย์ข้อมูลช่วยให้คุณได้รับความรู้เกี่ยวกับสิ่งต่อไปนี้:

ค่าใดที่เป็นค่าปกติมากที่สุดสำหรับตัวอย่าง เพื่อตอบคำถามนี้ จึงมีการกำหนดการวัดแนวโน้มจากส่วนกลาง

การแพร่กระจายของข้อมูลมีขนาดใหญ่เพียงใดเมื่อเทียบกับค่าคุณลักษณะนี้ เช่น "ความคลุมเครือ" ของข้อมูลคืออะไร ใน ในกรณีนี้มีการกำหนดมาตรการวัดความแปรปรวน

เป็นที่น่าสังเกตว่าตัวบ่งชี้ทางสถิติของแนวโน้มและความแปรปรวนส่วนกลางนั้นพิจารณาจากข้อมูลเชิงปริมาณเท่านั้น

มาตรการแนวโน้มส่วนกลาง– กลุ่มของค่าที่ข้อมูลส่วนที่เหลือถูกจัดกลุ่ม ดังนั้น การวัดแนวโน้มส่วนกลางจะสรุปอาร์เรย์ของข้อมูลซึ่งทำให้สามารถสร้างข้อสรุปทั้งเกี่ยวกับตัวอย่างโดยรวมและดำเนินการ การวิเคราะห์เปรียบเทียบตัวอย่างที่แตกต่างกันซึ่งกันและกัน

สมมติว่าเรามีตัวอย่างข้อมูล การวัดแนวโน้มส่วนกลางจะได้รับการประเมินโดยตัวบ่งชี้ต่อไปนี้:

1. ค่าเฉลี่ยตัวอย่างคือผลลัพธ์ของการหารผลรวมของค่าตัวอย่างทั้งหมดด้วยจำนวนที่กำหนดโดยสูตร (3.1)

(3.1)

ที่ไหน - ฉันองค์ประกอบที่ 3 ของการเลือก

n– จำนวนองค์ประกอบตัวอย่าง

ค่าเฉลี่ยตัวอย่างให้ความแม่นยำสูงสุดในกระบวนการประมาณค่าแนวโน้มจากศูนย์กลาง

2. ค่ามัธยฐาน– สร้างค่าด้านบนและด้านล่างซึ่งจำนวนค่าที่แตกต่างกันจะเท่ากัน กล่าวคือ นี่คือค่ากลางในชุดข้อมูลตามลำดับ กำหนดโดยขึ้นอยู่กับจำนวนองค์ประกอบที่เป็นคู่/คี่ในตัวอย่างโดยใช้สูตร (3.2) หรือ (3.3) อัลกอริทึมสำหรับการประมาณค่ามัธยฐานสำหรับตัวอย่างข้อมูล:

ประการแรก ข้อมูลจะถูกจัดอันดับ (เรียงลำดับ) จากมากไปน้อย/จากน้อยไปหามาก

หากตัวอย่างที่สั่งมีจำนวนองค์ประกอบเป็นเลขคี่ ค่ามัธยฐานจะตรงกับค่ากลาง

(3.2)

ที่ไหน n

ในกรณีขององค์ประกอบจำนวนคู่ ค่ามัธยฐานจะถูกกำหนดให้เป็นค่าเฉลี่ยเลขคณิตของค่ากลางทั้งสองค่า

(3.3)

องค์ประกอบเฉลี่ยของตัวอย่างที่สั่งอยู่ที่ไหน

- องค์ประกอบของการเลือกคำสั่งถัดจาก ;

จำนวนองค์ประกอบตัวอย่าง

หากองค์ประกอบตัวอย่างทั้งหมดแตกต่างกัน องค์ประกอบตัวอย่างครึ่งหนึ่งจะมีค่ามากกว่าค่ามัธยฐาน และอีกครึ่งหนึ่งจะน้อยกว่า ตัวอย่างเช่น สำหรับกลุ่มตัวอย่าง (1, 5, 9, 15, 16) ค่ามัธยฐานจะเท่ากับองค์ประกอบ 9

ในการวิเคราะห์ข้อมูลทางสถิติ ค่ามัธยฐานจะช่วยระบุองค์ประกอบตัวอย่างที่มีอิทธิพลอย่างมากต่อค่าของค่าเฉลี่ยตัวอย่าง

สมมติว่าเรามีกลุ่มตัวอย่างจำนวน 20 คน. องค์ประกอบตัวอย่างเป็นข้อมูลเกี่ยวกับรายได้เฉลี่ยต่อเดือนของแต่ละคน สมมติว่า 19 คนมีรายได้เฉลี่ยต่อเดือน 20,000 รูเบิล และ 1 คนที่มีรายได้ 300 ตัน รายได้รวมต่อเดือนของกลุ่มตัวอย่างทั้งหมดคือ 680 รูเบิล ค่ามัธยฐานหลังจากสั่งตัวอย่าง จะถูกกำหนดให้เป็นค่าเฉลี่ยเลขคณิตขององค์ประกอบที่สิบและสิบเอ็ดของกลุ่มตัวอย่าง) และเท่ากับ Me = 20 tr ผลลัพธ์นี้ตีความดังนี้: ค่ามัธยฐานแบ่งกลุ่มตัวอย่างออกเป็นสองกลุ่มเพื่อสรุปได้ว่าในกลุ่มแรกแต่ละคนมีรายได้เฉลี่ยต่อเดือนไม่เกิน 20,000 รูเบิลและในกลุ่มที่สองไม่น้อยกว่า 20,000 รูเบิล . ใน ในตัวอย่างนี้เราสามารถพูดได้ว่าค่ามัธยฐานนั้นมีลักษณะเฉพาะที่บุคคล "โดยเฉลี่ย" มีรายได้เท่าใด แม้ว่าค่าของค่าเฉลี่ยตัวอย่างจะเกินอย่างมีนัยสำคัญ S=34 ซึ่งบ่งชี้ถึงการยอมรับไม่ได้ของคุณลักษณะนี้เมื่อประเมินรายได้เฉลี่ย

ดังนั้น ยิ่งความแตกต่างระหว่างค่ามัธยฐานและค่าเฉลี่ยตัวอย่างมากเท่าใด การกระจายตัวของข้อมูลตัวอย่างก็จะยิ่งมากขึ้นเท่านั้น (ในตัวอย่างที่พิจารณา บุคคลที่มีรายได้ 300 รูเบิลจะแตกต่างจากคนทั่วไปในกลุ่มตัวอย่างเฉพาะอย่างชัดเจนและมีนัยสำคัญ กระทบต่อประมาณการรายได้เฉลี่ย) จะทำอย่างไรกับองค์ประกอบดังกล่าวจะถูกตัดสินใจในแต่ละกรณี แต่ในกรณีทั่วไป เพื่อให้มั่นใจในความน่าเชื่อถือของกลุ่มตัวอย่าง พวกเขาจะถูกลบออก เนื่องจากมีอิทธิพลอย่างมากต่อการประเมินตัวบ่งชี้ทางสถิติ

3. แฟชั่น (โม)– สร้างค่าที่เกิดขึ้นบ่อยที่สุดในตัวอย่าง เช่น ค่าที่มีความถี่สูงสุด อัลกอริธึมการประมาณค่าโหมด:

ในกรณีที่ตัวอย่างมีองค์ประกอบที่เกิดขึ้นบ่อยครั้งเท่ากัน กล่าวกันว่าไม่มีโหมดในตัวอย่างนี้

ถ้าสอง องค์ประกอบใกล้เคียงตัวอย่างมีความถี่เท่ากัน ซึ่งมากกว่าความถี่ขององค์ประกอบที่เหลือของตัวอย่าง จากนั้นโหมดจะถูกกำหนดให้เป็นค่าเฉลี่ยของทั้งสองค่านี้

หากองค์ประกอบตัวอย่างสองรายการมีความถี่เท่ากัน ซึ่งมากกว่าความถี่ขององค์ประกอบตัวอย่างที่เหลือ และองค์ประกอบเหล่านี้ไม่ได้อยู่ติดกัน ตัวอย่างจะมีสองโหมด

โหมดในการวิเคราะห์ทางสถิติใช้ในสถานการณ์ที่จำเป็นต้องมีการประเมินการวัดแนวโน้มจากส่วนกลางอย่างรวดเร็ว และไม่จำเป็นต้องมีความแม่นยำสูง ตัวอย่างเช่น แฟชั่น (ตามขนาดหรือแบรนด์) สามารถใช้เพื่อระบุเสื้อผ้าและรองเท้าที่เป็นที่ต้องการของลูกค้ามากที่สุดได้อย่างสะดวก

การวัดการกระจาย (ความแปรปรวน)– กลุ่มตัวบ่งชี้ทางสถิติที่แสดงลักษณะความแตกต่างระหว่างค่าตัวอย่างแต่ละค่า จากตัวบ่งชี้การวัดการกระจายตัว สามารถประเมินระดับความเป็นเนื้อเดียวกันและความแน่นขององค์ประกอบตัวอย่างได้ การวัดการกระจายตัวมีลักษณะเฉพาะโดยชุดตัวบ่งชี้ต่อไปนี้:

1. พิสัย -นี่คือช่วงเวลาระหว่างค่าสูงสุดและต่ำสุดของผลการสังเกต (องค์ประกอบตัวอย่าง) ตัวบ่งชี้ช่วงบ่งชี้การกระจายของค่าในชุดข้อมูล หากช่วงมีขนาดใหญ่ ค่าในผลรวมจะกระจัดกระจายมาก มิฉะนั้น (ช่วงจะน้อย) ว่ากันว่าค่าในผลรวมนั้นอยู่ใกล้กัน ช่วงถูกกำหนดโดยสูตร (3.4)

(3.4)

ที่ไหน - องค์ประกอบตัวอย่างสูงสุด

- องค์ประกอบตัวอย่างขั้นต่ำ

2.ส่วนเบี่ยงเบนเฉลี่ย– ผลต่างของค่าเฉลี่ยเลขคณิต (ในค่าสัมบูรณ์) ระหว่างแต่ละค่าในกลุ่มตัวอย่างกับค่าเฉลี่ยของกลุ่มตัวอย่าง ค่าเบี่ยงเบนเฉลี่ยถูกกำหนดโดยสูตร (3.5)

(3.5)

ที่ไหน - ฉันองค์ประกอบที่ 3 ของการเลือก

ค่าเฉลี่ยตัวอย่างคำนวณโดยใช้สูตร (3.1)

จำนวนองค์ประกอบตัวอย่าง

โมดูล จำเป็นเนื่องจากการเบี่ยงเบนจากค่าเฉลี่ยสำหรับแต่ละองค์ประกอบเฉพาะสามารถเป็นได้ทั้งบวกและลบ ดังนั้น หากคุณไม่เลือกโมดูล ผลรวมของการเบี่ยงเบนทั้งหมดจะเข้าใกล้ศูนย์ และจะเป็นไปไม่ได้ที่จะตัดสินระดับของความแปรปรวนของข้อมูล (การอัดแน่นของข้อมูลรอบๆ ค่าเฉลี่ยตัวอย่าง) เมื่อทำการวิเคราะห์ทางสถิติ อาจใช้โหมดและค่ามัธยฐานแทนค่าเฉลี่ยตัวอย่าง

3. การกระจายตัว- การวัดการกระจายตัวที่อธิบายค่าเบี่ยงเบนเปรียบเทียบระหว่างค่าข้อมูลและค่าเฉลี่ย คำนวณเป็นผลรวมของค่าเบี่ยงเบนกำลังสองของแต่ละองค์ประกอบตัวอย่างจากค่าเฉลี่ย ความแปรปรวนจะถูกประมาณไว้ ขึ้นอยู่กับขนาดของกลุ่มตัวอย่าง วิธีทางที่แตกต่าง:

สำหรับตัวอย่างขนาดใหญ่ (n>30) ตามสูตร (3.6)

(3.6)

สำหรับตัวอย่างขนาดเล็ก (n<30) по формуле (3.7)

(3.7)

โดยที่ X i คือองค์ประกอบตัวอย่างที่ i

S – ค่าเฉลี่ยตัวอย่าง;

จำนวนองค์ประกอบตัวอย่าง

(X i – S) - ส่วนเบี่ยงเบนจากค่าเฉลี่ยสำหรับแต่ละค่าของชุดข้อมูล

4. ส่วนเบี่ยงเบนมาตรฐาน-การวัดว่าจุดข้อมูลที่กระจัดกระจายในวงกว้างสัมพันธ์กับค่าเฉลี่ยของจุดเหล่านั้นอย่างไร

กระบวนการยกกำลังสองส่วนเบี่ยงเบนส่วนบุคคลเมื่อคำนวณความแปรปรวนจะเพิ่มระดับความเบี่ยงเบนของการเบี่ยงเบนที่เกิดขึ้นจากการเบี่ยงเบนเดิม ซึ่งจะทำให้เกิดข้อผิดพลาดเพิ่มเติม ดังนั้น เพื่อให้การประมาณค่าการแพร่กระจายของจุดข้อมูลสัมพันธ์กับค่าเฉลี่ยใกล้กับค่าเบี่ยงเบนเฉลี่ย จึงต้องใช้รากที่สองของความแปรปรวน รากที่แยกออกมาของความแปรปรวนจะแสดงลักษณะเฉพาะของการวัดความแปรปรวนที่เรียกว่าค่าเฉลี่ยรากกำลังสองหรือส่วนเบี่ยงเบนมาตรฐาน (3.8)

(3.8)

สมมติว่าคุณเป็นผู้จัดการโครงการพัฒนาซอฟต์แวร์ คุณมีโปรแกรมเมอร์ห้าคนภายใต้คำสั่งของคุณ ด้วยการจัดการกระบวนการดำเนินโครงการ คุณจะกระจายงานระหว่างโปรแกรมเมอร์ เพื่อให้ตัวอย่างง่ายขึ้น เราจะดำเนินการต่อจากข้อเท็จจริงที่ว่างานมีความซับซ้อนและเวลาในการดำเนินการเท่ากัน คุณตัดสินใจวิเคราะห์งานของโปรแกรมเมอร์แต่ละคน (จำนวนงานที่เสร็จสมบูรณ์ในระหว่างสัปดาห์) ในช่วง 10 สัปดาห์ที่ผ่านมา ซึ่งส่งผลให้คุณได้รับตัวอย่างต่อไปนี้:

ชื่อสัปดาห์

โดยการประมาณจำนวนเฉลี่ยของงานที่เสร็จสมบูรณ์ คุณจะได้ผลลัพธ์ต่อไปนี้:

ชื่อสัปดาห์											ส
											22,3
											22,4
											22,2
											22,1
											22,5

ตามตัวบ่งชี้ S โปรแกรมเมอร์ทุกคนทำงานโดยเฉลี่ยโดยมีประสิทธิภาพเท่ากัน (ประมาณ 22 งานต่อสัปดาห์) อย่างไรก็ตาม ตัวบ่งชี้ความแปรปรวน (ช่วง) นั้นสูงมาก (จาก 5 งานสำหรับโปรแกรมเมอร์ตัวที่สี่ถึง 24 งานสำหรับตัวที่ห้า)

ชื่อสัปดาห์	ส	ป
	22,3
	22,4
	22,2
	22,1
	22,5

ลองประมาณค่าเบี่ยงเบนมาตรฐานซึ่งแสดงให้เห็นว่าค่าในกลุ่มตัวอย่างมีการกระจายอย่างไรสัมพันธ์กับค่าเฉลี่ย และโดยเฉพาะอย่างยิ่งในกรณีของเรา ให้ประมาณว่าการแพร่กระจายในการทำงานให้เสร็จสิ้นในแต่ละสัปดาห์มีขนาดใหญ่เพียงใด

ชื่อสัปดาห์	ส	ป	ดังนั้น
	22,3		1,56
	22,4		1,8
	22,2		2,84
	22,1		1,3
	22,5		5,3

ผลการประมาณค่าส่วนเบี่ยงเบนมาตรฐานจะระบุสิ่งต่อไปนี้ (เราจะประเมินกรณีสุดโต่งสองกรณี โปรแกรมเมอร์ 4 และ 5):

แต่ละค่าในตัวอย่างโปรแกรมเมอร์ 4 คนเบี่ยงเบนโดยเฉลี่ย 1.3 ค่าจากค่าเฉลี่ย

แต่ละค่าในตัวอย่างโปรแกรมเมอร์ 5 เบี่ยงเบนโดยเฉลี่ย 5.3 รายการจากค่าเฉลี่ย

ยิ่งค่าเบี่ยงเบนมาตรฐานเข้าใกล้ 0 มากเท่าใด ค่าเฉลี่ยก็น่าเชื่อถือมากขึ้นเท่านั้น เนื่องจากค่าแต่ละค่าในกลุ่มตัวอย่างเกือบจะเท่ากับค่าเฉลี่ย (ในตัวอย่างของเราคือ 22.5 รายการ) ดังนั้นโปรแกรมเมอร์ 4 จึงมีความสอดคล้องมากที่สุด ไม่เหมือนโปรแกรมเมอร์ 5 ความแปรปรวนของการทำงานให้เสร็จสิ้นในแต่ละสัปดาห์สำหรับโปรแกรมเมอร์คนที่ 5 คือ 5.3 งาน ซึ่งบ่งบอกถึงการแพร่กระจายที่สำคัญ ในกรณีของโปรแกรมเมอร์คนที่ 5 ไม่สามารถเชื่อถือค่าเฉลี่ยได้ ดังนั้นจึงเป็นเรื่องยากที่จะคาดการณ์จำนวนงานที่เสร็จสมบูรณ์ในสัปดาห์หน้า ซึ่งจะทำให้ขั้นตอนการวางแผนและการยึดตามตารางงานมีความซับซ้อนยิ่งขึ้น ไม่สำคัญว่าคุณจะตัดสินใจด้านการจัดการอะไรในหลักสูตรนี้ สิ่งสำคัญคือคุณต้องได้รับการประเมินตามที่คุณสามารถตัดสินใจด้านการจัดการได้อย่างเหมาะสม

ดังนั้นจึงสามารถสรุปโดยทั่วไปได้ว่าค่าเฉลี่ยไม่ได้ประเมินข้อมูลอย่างถูกต้องเสมอไป ความถูกต้องของการประมาณค่าเฉลี่ยสามารถตัดสินได้จากค่าส่วนเบี่ยงเบนมาตรฐาน

วิธีการประมวลผลทางสถิติของผลการทดลองคือเทคนิคทางคณิตศาสตร์สูตรวิธีการคำนวณเชิงปริมาณด้วยความช่วยเหลือซึ่งตัวบ่งชี้ที่ได้รับระหว่างการทดลองสามารถสรุปได้ทั่วไปนำเข้าสู่ระบบโดยเปิดเผยรูปแบบที่ซ่อนอยู่ในตัวพวกเขา

เรากำลังพูดถึงรูปแบบของลักษณะทางสถิติที่มีอยู่ระหว่างตัวแปรที่ศึกษาในการทดลอง

ข้อมูล เป็นองค์ประกอบพื้นฐานที่จะจำแนกหรือจัดหมวดหมู่เพื่อวัตถุประสงค์ในการประมวลผล 26

วิธีการวิเคราะห์ทางคณิตศาสตร์ - สถิติบางวิธีทำให้สามารถคำนวณสิ่งที่เรียกว่าสถิติทางคณิตศาสตร์เบื้องต้นซึ่งระบุลักษณะการกระจายตัวอย่างข้อมูลได้เช่น:

ค่าเฉลี่ยตัวอย่าง

ความแปรปรวนตัวอย่าง

ค่ามัธยฐานและอื่น ๆ อีกจำนวนหนึ่ง

วิธีอื่นๆ ของสถิติทางคณิตศาสตร์ทำให้สามารถตัดสินพลวัตของการเปลี่ยนแปลงในสถิติตัวอย่างแต่ละรายการได้ เช่น

การวิเคราะห์ความแปรปรวน

การวิเคราะห์การถดถอย

เมื่อใช้วิธีการสุ่มตัวอย่างข้อมูลกลุ่มที่สาม เราสามารถตัดสินความสัมพันธ์ทางสถิติที่มีอยู่ระหว่างตัวแปรที่ศึกษาในการทดลองนี้ได้อย่างน่าเชื่อถือ:

การวิเคราะห์สหสัมพันธ์

การวิเคราะห์ปัจจัย

วิธีการเปรียบเทียบ

วิธีการวิเคราะห์ทางคณิตศาสตร์และสถิติทั้งหมดแบ่งตามอัตภาพออกเป็นประถมศึกษาและมัธยมศึกษา 27

วิธีการหลักคือวิธีการที่ใช้เพื่อให้ได้ตัวบ่งชี้ที่สะท้อนผลการวัดที่ทำในการทดลองโดยตรง

วิธีรองเรียกว่าวิธีการประมวลผลทางสถิติด้วยความช่วยเหลือซึ่งรูปแบบทางสถิติที่ซ่อนอยู่ในนั้นจะถูกเปิดเผยบนพื้นฐานของข้อมูลหลัก

วิธีการหลักในการประมวลผลทางสถิติได้แก่:

การหาค่าเฉลี่ยตัวอย่าง

ความแปรปรวนตัวอย่าง

แฟชั่นที่คัดสรร;

ค่ามัธยฐานตัวอย่าง

วิธีการรองมักประกอบด้วย:

การวิเคราะห์สหสัมพันธ์

การวิเคราะห์การถดถอย

วิธีเปรียบเทียบสถิติปฐมภูมิในกลุ่มตัวอย่างตั้งแต่ 2 ตัวอย่างขึ้นไป

พิจารณาวิธีคำนวณสถิติทางคณิตศาสตร์เบื้องต้นโดยเริ่มจากค่าเฉลี่ยตัวอย่าง

ค่าเฉลี่ยเลขคณิต – เป็นอัตราส่วนของผลรวมของค่าข้อมูลทั้งหมดต่อจำนวนเทอม 28

ค่าเฉลี่ยที่เป็นตัวบ่งชี้ทางสถิติแสดงถึงการประเมินคุณภาพทางจิตวิทยาโดยเฉลี่ยที่ศึกษาในการทดลอง

การประเมินนี้แสดงถึงระดับของการพัฒนาโดยรวมในกลุ่มวิชาที่ได้รับการตรวจทางจิตเวช ด้วยการเปรียบเทียบค่าเฉลี่ยของกลุ่มตัวอย่างตั้งแต่สองตัวอย่างขึ้นไปโดยตรง เราสามารถตัดสินระดับการพัฒนาสัมพัทธ์ของคุณภาพที่ประเมินในกลุ่มคนที่สร้างกลุ่มตัวอย่างเหล่านี้ได้

ค่าเฉลี่ยตัวอย่างถูกกำหนดโดยใช้สูตร 29 ต่อไปนี้:

โดยที่ x cf คือค่าเฉลี่ยตัวอย่างหรือค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง

n คือจำนวนวิชาในกลุ่มตัวอย่างหรือตัวบ่งชี้การวินิจฉัยทางจิตเวชส่วนตัวโดยพิจารณาจากค่าเฉลี่ยที่คำนวณ

x k - ค่าส่วนตัวของตัวบ่งชี้สำหรับแต่ละวิชา มีตัวบ่งชี้ทั้งหมด n ตัวดังนั้นดัชนี k ของตัวแปรนี้จึงรับค่าตั้งแต่ 1 ถึง n

∑ เป็นเครื่องหมายที่ยอมรับในวิชาคณิตศาสตร์ในการรวมค่าของตัวแปรที่อยู่ทางด้านขวาของเครื่องหมายนี้

การกระจายตัว คือการวัดการแพร่กระจายของข้อมูลสัมพันธ์กับค่าเฉลี่ย 30

ยิ่งความแปรปรวนมากเท่าใด ความเบี่ยงเบนหรือการแพร่กระจายของข้อมูลก็จะยิ่งมากขึ้นเท่านั้น มีการกำหนดเพื่อให้สามารถแยกความแตกต่างจากค่าอื่น ๆ ที่มีค่าเฉลี่ยเท่ากัน แต่มีการกระจายต่างกัน

ความแปรปรวนถูกกำหนดโดยสูตรต่อไปนี้:

ความแปรปรวนตัวอย่างอยู่ที่ไหน หรือเพียงแค่ความแปรปรวน

นิพจน์หมายความว่าสำหรับ xk ทั้งหมดตั้งแต่ตัวแรกจนถึงตัวสุดท้ายในตัวอย่างที่กำหนดให้ จำเป็นต้องคำนวณความแตกต่างระหว่างค่าบางส่วนและค่าเฉลี่ย จัดกำลังสองความแตกต่างเหล่านี้แล้วรวมเข้าด้วยกัน

n คือจำนวนวิชาในกลุ่มตัวอย่างหรือค่าหลักที่ใช้คำนวณความแปรปรวน

ค่ามัธยฐาน คือค่าของคุณลักษณะที่กำลังศึกษาโดยแบ่งกลุ่มตัวอย่างโดยเรียงลำดับตามค่าของคุณลักษณะนี้ครึ่งหนึ่ง

การรู้ค่ามัธยฐานมีประโยชน์ในการพิจารณาว่าการกระจายตัวของค่าบางส่วนของคุณลักษณะที่ศึกษานั้นมีความสมมาตรและใกล้เคียงกับการแจกแจงแบบปกติหรือไม่ ค่าเฉลี่ยและค่ามัธยฐานของการแจกแจงแบบปกติมักจะเท่ากันหรือต่างกันน้อยมาก

หากการกระจายตัวอย่างคุณลักษณะเป็นเรื่องปกติ ก็สามารถใช้วิธีการคำนวณทางสถิติรองตามการกระจายข้อมูลแบบปกติได้ มิฉะนั้นจะไม่สามารถทำได้เนื่องจากข้อผิดพลาดร้ายแรงอาจคืบคลานเข้าสู่การคำนวณ

แฟชั่น สถิติทางคณิตศาสตร์เบื้องต้นอีกประการหนึ่งและลักษณะของการกระจายข้อมูลการทดลอง Mode คือค่าเชิงปริมาณของคุณลักษณะที่กำลังศึกษา ซึ่งมักพบในตัวอย่าง

สำหรับการกระจายคุณสมบัติแบบสมมาตรรวมถึงการแจกแจงแบบปกติ ค่าโหมดจะตรงกับค่ากลางและค่ามัธยฐาน สำหรับการแจกแจงประเภทอื่นๆ ที่ไม่สมมาตร นี่ไม่ใช่เรื่องปกติ

วิธีการประมวลผลทางสถิติทุติยภูมิซึ่งกำหนดการเชื่อมต่อหรือการพึ่งพาโดยตรงระหว่างข้อมูลการทดลองสองชุดเรียกว่า วิธีการวิเคราะห์สหสัมพันธ์ มันแสดงให้เห็นว่าปรากฏการณ์หนึ่งมีอิทธิพลหรือเกี่ยวข้องกับปรากฏการณ์อื่นอย่างไรในพลวัตของมัน มีการพึ่งพาประเภทนี้อยู่ เช่น ระหว่างปริมาณที่อยู่ในความสัมพันธ์ระหว่างเหตุและผลซึ่งกันและกัน หากปรากฏว่าปรากฏการณ์ทั้งสองมีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติ และหากมีความมั่นใจว่าปรากฏการณ์หนึ่งสามารถเป็นสาเหตุของอีกปรากฏการณ์หนึ่งได้ สรุปได้ว่า มีความสัมพันธ์ระหว่างเหตุและผลอย่างแน่นอน ดังต่อไปนี้

วิธีการนี้มีหลายประเภท:

การวิเคราะห์ความสัมพันธ์เชิงเส้นทำให้คุณสามารถสร้างการเชื่อมต่อโดยตรงระหว่างตัวแปรตามค่าสัมบูรณ์ได้ การเชื่อมต่อเหล่านี้แสดงเป็นเส้นตรงแบบกราฟิก จึงเป็นที่มาของชื่อ "เชิงเส้น"

ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นถูกกำหนดโดยใช้สูตรต่อไปนี้ 31:

ที่ไหน r xy - สัมประสิทธิ์สหสัมพันธ์เชิงเส้น

เอ็กซ์ ย -ค่าตัวอย่างเฉลี่ยของค่าที่เปรียบเทียบ

เอ็กซ์ ฉัน ,ย ฉัน - ค่าตัวอย่างส่วนตัวของปริมาณที่เปรียบเทียบ

พี -จำนวนค่าทั้งหมดในชุดตัวบ่งชี้ที่เปรียบเทียบ

การกระจายตัวการเบี่ยงเบนของค่าที่เปรียบเทียบจากค่าเฉลี่ย

ความสัมพันธ์ของอันดับเป็นตัวกำหนดการพึ่งพาไม่ได้ระหว่างค่าสัมบูรณ์ของตัวแปร แต่ระหว่างตำแหน่งลำดับหรืออันดับที่ถูกครอบครองโดยพวกมันในชุดเรียงลำดับตามค่า สูตรสำหรับค่าสัมประสิทธิ์สหสัมพันธ์อันดับมีดังนี้ 32:

โดยที่ R s คือสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมน

ง ฉัน - ความแตกต่างระหว่างอันดับตัวบ่งชี้ของวิชาเดียวกันตามลำดับ

พี -จำนวนวิชาหรือข้อมูลดิจิทัล (อันดับ) ในชุดที่สัมพันธ์กัน

วัตถุประสงค์ของบทเรียน:
- การสร้างเงื่อนไขสำหรับการเรียนรู้หัวข้อในระดับความเข้าใจและการท่องจำเบื้องต้น
- เพื่อพัฒนาความสามารถทางคณิตศาสตร์ของบุคลิกภาพของนักเรียน

วัตถุประสงค์ของบทเรียน
เกี่ยวกับการศึกษา:สร้างแนวคิดทางสถิติในฐานะวิทยาศาสตร์ ทำให้นักเรียนคุ้นเคยกับแนวคิดเกี่ยวกับลักษณะทางสถิติพื้นฐาน พัฒนาความสามารถในการค้นหาช่วงและโหมดของซีรีส์ วิเคราะห์ข้อมูล และพัฒนาทักษะการคำนวณทางจิต
เกี่ยวกับการศึกษา:ส่งเสริมการเรียนรู้แนวคิดและการตีความ การพัฒนาทักษะเหนือวิชาในการวิเคราะห์ การเปรียบเทียบ การจัดระบบและลักษณะทั่วไป ดำเนินการสร้างภาษาประจำวิชาต่อไป ส่งเสริมการก่อตัวของความสามารถหลัก (ความรู้ความเข้าใจ ข้อมูล การสื่อสาร) ในขั้นตอนต่างๆ ของบทเรียน ส่งเสริมการสร้างภาพทางวิทยาศาสตร์ที่เป็นหนึ่งเดียวของโลกในหมู่นักเรียนโดยระบุความเชื่อมโยงแบบสหวิทยาการระหว่างสถิติและวิทยาศาสตร์ต่างๆ
เกี่ยวกับการศึกษา:ปลูกฝังความสนใจในเรื่องที่กำลังศึกษาวัฒนธรรมสารสนเทศ ความพร้อมในการปฏิบัติตามบรรทัดฐานและกฎเกณฑ์ที่เป็นที่ยอมรับโดยทั่วไป มีประสิทธิภาพและองค์กรสูง

เทคโนโลยีที่ใช้: เทคโนโลยีการเรียนรู้ที่เน้นผู้เรียนเป็นศูนย์กลาง เทคโนโลยีสารสนเทศและการสื่อสาร
อุปกรณ์ที่จำเป็น, วัสดุ: โปรเจคเตอร์มัลติมีเดีย คอมพิวเตอร์ ไวท์บอร์ดแบบโต้ตอบ

ในระหว่างเรียน

1. ช่วงเวลาขององค์กร

การตรวจสอบความพร้อมของนักเรียนในชั้นเรียน

การตรวจสอบการเข้าร่วม

2. การตั้งเป้าหมาย

เหตุผลความจำเป็นในการศึกษาหัวข้อนี้

ให้นักเรียนมีส่วนร่วมในกระบวนการกำหนดเป้าหมายบทเรียน

เราได้รับและรวบรวมข้อมูลจากแหล่งใด (คำตอบที่แนะนำ: วิทยุ โทรทัศน์ หนังสือพิมพ์ นิตยสาร โทรศัพท์ บุคคล อินเทอร์เน็ต จดหมาย)

ผู้คนเก็บข้อมูลไว้ที่ไหน? (คำตอบที่แนะนำ. : ในหน่วยความจำและสื่อภายนอก)
การเรียนที่โรงเรียนเทคนิคเกี่ยวกับการรับข้อมูลหรือไม่? ที่โรงเรียนคุณเรียนวิชาการศึกษาทั่วไป แต่เมื่อคุณเรียนที่โรงเรียนเทคนิค คุณจะได้อะไรอีกบ้าง (คำตอบที่แนะนำ: ส ความรู้ทางวิชาชีพ)ยิ่งเราเรียนรู้มากเท่าไร ข้อมูลในความทรงจำของเราก็จะยิ่งมีมากขึ้นเท่านั้น

วันนี้ผมขอเสนอข้อมูลอีกชิ้นหนึ่งให้กับคุณ คุณได้รับการฝึกอบรมให้เป็นผู้ปฏิบัติงานเหมืองแร่ คุณจะทำงานกับรถขุด EKG-8I ประสิทธิภาพของรถขุดนี้คืออะไร ตามคำขอของฉัน โรงงานได้ให้ข้อมูลต่อไปนี้แก่ฉัน (ประสิทธิภาพของรถขุด - ตาราง)



โดยเศษหิน (พันตัน)

เพื่อนๆ ข้อมูลเยอะดีมั้ย? ข้อมูลทั้งหมดจะมีประโยชน์และมีคุณภาพสูงได้หรือไม่? เราควรทำอย่างไรเพื่อไม่ให้หลงเข้าไปในเขาวงกตของข้อมูล? (คำตอบที่คาดหวังของนักเรียน: “ต้องสามารถแยกข้อมูลที่เป็นประโยชน์และมีคุณภาพสูงออกจากข้อมูลที่มีคุณภาพต่ำได้”) เหล่านั้น. สามารถประมวลผลได้

สรุป: วันนี้ในบทเรียนเราจะเรียนรู้การประมวลผลข้อมูล

3. การจัดกิจกรรมเพื่อศึกษาเนื้อหาใหม่(นักเรียนจดบันทึกในสมุดบันทึกและทำงานที่ได้รับมอบหมายในระหว่างกระบวนการอธิบาย)

1. คำจำกัดความของสถิติ

สถิติคืออะไร? ว่ากันว่านายกรัฐมนตรีอังกฤษ เบนจามิน ดิสเรลี (พ.ศ. 2347 - 2424) ตอบคำถามนี้ดังนี้: "การโกหกมีสามประเภท: การโกหก การโกหกสาปแช่ง และสถิติ"

สถิติเป็นวิทยาศาสตร์ที่แน่นอนที่ศึกษาวิธีการรวบรวม วิเคราะห์ และประมวลผลข้อมูลที่อธิบายการกระทำ ปรากฏการณ์ และกระบวนการของมวล

(อ่านข้อความที่ตัดตอนมาจากนวนิยายเรื่อง "The Twelve Chairs" โดย Ilf และ Petrov

“ สถิติรู้ทุกอย่าง” เป็นที่รู้กันว่าพลเมืองโดยเฉลี่ยของสาธารณรัฐกินอาหารได้มากเพียงใดต่อปี: เป็นที่รู้กันว่ามีนักล่านักบัลเล่ต์กี่คน: เครื่องจักร, จักรยาน, อนุสาวรีย์, ประภาคารและจักรเย็บผ้าในประเทศ: ชีวิตเต็มอิ่มแค่ไหน ความกระตือรือร้น ความหลงใหล และความคิด มองเราจากตารางสถิติ!..”

ชื่อของมันมาจากคำภาษาละติน "สถานะ" - รัฐจากรากนี้คำว่า stato (อิตาลี), statistik (เยอรมัน), รัฐ (อังกฤษ) - รัฐ

การศึกษาสถิติ:

เป้าหมายหลักของการศึกษาองค์ประกอบของสถิติ:

จำนวนกลุ่มประชากรแต่ละกลุ่มของประเทศและภูมิภาค
การผลิตและการบริโภคผลิตภัณฑ์ประเภทต่างๆ
การขนส่งสินค้าและคนโดยสารด้วยการขนส่งรูปแบบต่างๆ
ทรัพยากรธรรมชาติ และอื่นๆ อีกมากมาย

คุณรู้หรือไม่ว่าการปฏิบัติทางสถิติในประเทศใดเริ่มต้นขึ้น (ในประเทศจีน) การสำรวจสำมะโนประชากรครั้งแรกของประเทศมีอายุย้อนกลับไปในศตวรรษที่ 5 II สหัสวรรษก่อนคริสต์ศักราช

ในศตวรรษที่ 19 มีความเป็นไปได้ที่จะประมวลผลข้อมูลโดยใช้สูตร กฎทางคณิตศาสตร์ และคุณลักษณะพิเศษ นี้?.... ( เสื่อ. สถิติ).

2. สถิติทางคณิตศาสตร์

สถิติทางคณิตศาสตร์เป็นสาขาวิชาคณิตศาสตร์ที่ศึกษาวิธีการรวบรวม จัดระบบ และประมวลผลผลการสังเกตปรากฏการณ์มวลสุ่มเพื่อระบุรูปแบบที่มีอยู่

แล้วทำไมดิสเรลีถึงเปรียบเทียบสถิติกับการโกหก? (ไม่มีการประมวลผลข้อมูลทางวิทยาศาสตร์ที่เข้มงวด ข้อมูลถูกตีความโดยใครก็ตามที่ต้องการ)

สถิติทางคณิตศาสตร์มีวิธีการประมวลผลข้อมูลที่เป็นสากล
นี่คือสิ่งที่ทำให้ฮีโร่ของภาพยนตร์เรื่อง "Office Romance" พูดคำต่อไปนี้เกี่ยวกับสถิติ ( ส่วนหนึ่งของภาพยนตร์เรื่อง "Office Romance").
สรุป: สถิตินำข้อมูลเข้าสู่ระบบ

3. การแสดงข้อมูลแบบกราฟิก

รูปหลายเหลี่ยมการกระจาย

ฮิสโตแกรมการกระจาย

แผนภูมิวงกลม

4. ลักษณะการวัด
1. ชุดข้อมูลคือชุดผลลัพธ์ของการวัดใดๆ

ตัวอย่างเช่น: 1) การวัดความสูงของมนุษย์

2) การวัดน้ำหนักมนุษย์ (สัตว์)

3) ค่ามิเตอร์ (ไฟฟ้า, น้ำ, ความร้อน...)

4) ผลการแข่งขันในระยะ 100 เมตร

2. ปริมาตรของชุดข้อมูล - ปริมาตรของชุดข้อมูลคือจำนวนข้อมูลทั้งหมด

ตัวอย่างเช่น:ให้ชุดตัวเลข 1; 3; 6; -4; 0

ปริมาตรของมันจะเท่ากับ 5 ทำไม?

3. ช่วงของชุดข้อมูลคือความแตกต่างระหว่างตัวเลขที่ใหญ่ที่สุดและน้อยที่สุดจากชุดข้อมูล

ตัวอย่างเช่น:ถ้าได้รับชุดตัวเลข 1; 3; 6; -4; 0; 2 แล้ว ขอบเขตชุดข้อมูลนี้จะเท่ากับ 6 (เนื่องจาก 6 - 0 = 6)

4. โหมดของชุดข้อมูล - โหมดของชุดข้อมูลคือจำนวนชุดข้อมูลที่เกิดขึ้นบ่อยที่สุดในชุดข้อมูลนี้

ตัวอย่างเช่น: น Data Poison อาจมีหรือไม่มีโหมดก็ได้

ดังนั้น ในชุดข้อมูล 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 แต่ละหมายเลข 47 และ 52 เกิดขึ้นสองครั้ง และตัวเลขที่เหลือน้อยกว่าสองครั้ง ในกรณีเช่นนี้ มีการตกลงกันว่าซีรีส์นี้มีสองโหมด: 47 และ 52

5. ค่ามัธยฐานของซีรีส์

ค่ามัธยฐานที่มีพจน์เป็นเลขคี่คือตัวเลขที่เขียนไว้ตรงกลาง

ค่ามัธยฐานที่มีพจน์เป็นจำนวนคู่ - นี่คือค่าเฉลี่ยเลขคณิตของตัวเลขสองตัวที่เขียนไว้ตรงกลาง

ตัวอย่างเช่น: กำหนดค่ามัธยฐานของชุดตัวเลข

16; -4; 5; -2; -3; 3; 3; -2; 3. คำตอบ: -3

2) -1; 0; 2; 1; -1; 0;2; -1. คำตอบ: 0

6. ค่าเฉลี่ยเลขคณิตคือผลหารของการหารผลรวมของตัวเลขในชุดด้วยตัวเลข

ตัวอย่างเช่น: ให้ชุดตัวเลข -1; 0; 2; 1; -1; 0; 2; -1. จากนั้นค่าเฉลี่ยเลขคณิตจะเท่ากับ: (-1+0+2+1+(-1)+0+2+(-1)): 8 = 2: 8 = 0.25

4. การรวมเนื้อหาที่ศึกษา

การปฏิบัติงาน

ออกกำลังกาย:อธิบายลักษณะการปฏิบัติงานของนักเรียน Peter Ivanov ในวิชาคณิตศาสตร์สำหรับไตรมาสที่สี่

เสร็จสิ้นการทำงาน:

1. การรวบรวมข้อมูล:

เกรดที่เขียนจากนิตยสารคือ: 5,4,5,3,3,5,4,4,4

2. การประมวลผลข้อมูลที่ได้รับ:

การบรรยายครั้งที่ 12 วิธีการประมวลผลผลลัพธ์ทางสถิติ

วิธีการประมวลผลผลลัพธ์ทางสถิติเรียกว่าเทคนิคทางคณิตศาสตร์สูตรวิธีการคำนวณเชิงปริมาณด้วยความช่วยเหลือซึ่งตัวบ่งชี้ที่ได้รับระหว่างการทดลองสามารถสรุปได้นำเข้าสู่ระบบโดยเปิดเผยรูปแบบที่ซ่อนอยู่ในตัวพวกเขา เรากำลังพูดถึงรูปแบบของลักษณะทางสถิติที่มีอยู่ระหว่างตัวแปรที่ศึกษาในการทดลอง

1. วิธีการประมวลผลทางสถิติเบื้องต้นของผลการทดลอง

วิธีการวิเคราะห์ทางคณิตศาสตร์และสถิติทั้งหมดแบ่งออกเป็นระดับประถมศึกษาและมัธยมศึกษาตามอัตภาพ วิธีการหลักคือวิธีการที่ใช้เพื่อให้ได้ตัวบ่งชี้ที่สะท้อนผลการวัดที่ทำในการทดลองโดยตรง ดังนั้น โดยตัวบ่งชี้ทางสถิติหลัก เราหมายถึงตัวบ่งชี้ที่ใช้ในวิธีวินิจฉัยทางจิตเวชและเป็นผลมาจากการประมวลผลทางสถิติเบื้องต้นของผลการวินิจฉัยทางจิต วิธีรองเรียกว่าวิธีการประมวลผลทางสถิติด้วยความช่วยเหลือซึ่งรูปแบบทางสถิติที่ซ่อนอยู่ในนั้นจะถูกเปิดเผยบนพื้นฐานของข้อมูลหลัก

วิธีการหลักของการประมวลผลทางสถิติได้แก่ การหาค่าเฉลี่ยตัวอย่าง ความแปรปรวนของตัวอย่าง โหมดตัวอย่าง และค่ามัธยฐานของตัวอย่าง วิธีรองมักจะรวมถึงการวิเคราะห์สหสัมพันธ์ การวิเคราะห์การถดถอย และวิธีการเปรียบเทียบสถิติปฐมภูมิในกลุ่มตัวอย่างตั้งแต่สองตัวอย่างขึ้นไป

พิจารณาวิธีการคำนวณสถิติทางคณิตศาสตร์เบื้องต้น

แฟชั่นพวกเขาเรียกค่าเชิงปริมาณของคุณลักษณะที่กำลังศึกษาซึ่งมักพบในตัวอย่าง

ค่ามัธยฐานคือค่าของคุณลักษณะที่กำลังศึกษาโดยแบ่งกลุ่มตัวอย่างโดยเรียงลำดับตามค่าของคุณลักษณะนี้ครึ่งหนึ่ง

ค่าเฉลี่ยตัวอย่าง(ค่าเฉลี่ยเลขคณิต) เป็นตัวบ่งชี้ทางสถิติแสดงถึงการประเมินโดยเฉลี่ยของคุณภาพทางจิตวิทยาที่ศึกษาในการทดลอง

กระจาย(บางครั้งค่านี้เรียกว่าช่วง) ของกลุ่มตัวอย่างจะแสดงด้วยตัวอักษร R นี่เป็นตัวบ่งชี้ที่ง่ายที่สุดที่สามารถหาได้สำหรับตัวอย่าง - ความแตกต่างระหว่างค่าสูงสุดและต่ำสุดของชุดรูปแบบเฉพาะนี้

การกระจายตัวคือค่าเฉลี่ยเลขคณิตของการเบี่ยงเบนกำลังสองของค่าของตัวแปรจากค่าเฉลี่ย

2. วิธีการประมวลผลทางสถิติทุติยภูมิของผลการทดลอง

ด้วยความช่วยเหลือของวิธีรองในการประมวลผลข้อมูลการทดลองทางสถิติ สมมติฐานที่เกี่ยวข้องกับการทดลองจะได้รับการทดสอบ พิสูจน์ หรือหักล้างโดยตรง ตามกฎแล้ววิธีการเหล่านี้มีความซับซ้อนมากกว่าวิธีการประมวลผลทางสถิติเบื้องต้น และกำหนดให้ผู้วิจัยต้องได้รับการฝึกอบรมอย่างดีในด้านคณิตศาสตร์และสถิติเบื้องต้น

กลุ่มวิธีการภายใต้การสนทนาสามารถแบ่งออกเป็นกลุ่มย่อยได้หลายกลุ่ม:

1 แคลคูลัสการถดถอย

แคลคูลัสการถดถอยเป็นวิธีการหนึ่งของสถิติทางคณิตศาสตร์ที่ทำให้สามารถลดข้อมูลส่วนตัวที่กระจัดกระจายลงเหลือเพียงกราฟเชิงเส้นบางกราฟที่สะท้อนถึงความสัมพันธ์ภายในโดยประมาณ และสามารถประมาณค่าที่เป็นไปได้ของตัวแปรอื่นโดยอิงจากค่าของหนึ่งในนั้น ตัวแปร

2.สหสัมพันธ์

วิธีถัดไปของการประมวลผลทางสถิติรองซึ่งมีการกำหนดการเชื่อมต่อหรือการพึ่งพาโดยตรงระหว่างข้อมูลการทดลองสองชุดเรียกว่าวิธีความสัมพันธ์ มันแสดงให้เห็นว่าปรากฏการณ์หนึ่งมีอิทธิพลหรือเกี่ยวข้องกับปรากฏการณ์อื่นอย่างไรในพลวัตของมัน มีการพึ่งพาประเภทนี้อยู่ เช่น ระหว่างปริมาณที่อยู่ในความสัมพันธ์ระหว่างเหตุและผลซึ่งกันและกัน หากปรากฏว่าปรากฏการณ์ทั้งสองมีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติ และหากมีความมั่นใจว่าปรากฏการณ์หนึ่งสามารถเป็นสาเหตุของอีกปรากฏการณ์หนึ่งได้ สรุปได้ว่า มีความสัมพันธ์ระหว่างเหตุและผลอย่างแน่นอน ดังต่อไปนี้

3 การวิเคราะห์ปัจจัย

การวิเคราะห์ปัจจัยเป็นวิธีการทางสถิติที่ใช้ในการประมวลผลข้อมูลการทดลองจำนวนมาก วัตถุประสงค์ของการวิเคราะห์ปัจจัยคือ การลดจำนวนตัวแปร (การลดข้อมูล) และการกำหนดโครงสร้างความสัมพันธ์ระหว่างตัวแปร ได้แก่ การจำแนกตัวแปร ดังนั้น การวิเคราะห์ปัจจัยจึงใช้เป็นวิธีการลดข้อมูลหรือวิธีการจำแนกโครงสร้าง

ทบทวนคำถาม

1.วิธีการประมวลผลทางสถิติคืออะไร?

2.กลุ่มย่อยใดบ้างที่เป็นวิธีรองของการประมวลผลทางสถิติแบ่งออกเป็น?

3.อธิบายสาระสำคัญของวิธีสหสัมพันธ์ได้อย่างไร

4. ในกรณีใดบ้างที่ใช้วิธีการประมวลผลทางสถิติ?

5. คุณคิดว่าการใช้วิธีประมวลผลทางสถิติในการวิจัยทางวิทยาศาสตร์มีประสิทธิผลเพียงใด

2. พิจารณาคุณสมบัติของวิธีการประมวลผลข้อมูลทางสถิติ

วรรณกรรม

1.. กอร์บาตอฟ ดี.เอส. การประชุมเชิงปฏิบัติการเรื่องการวิจัยทางจิตวิทยา: Proc. เบี้ยเลี้ยง. - Samara: "BAKHRAH - M", 2546 - 272 หน้า

2. Ermolaev A.Yu. สถิติทางคณิตศาสตร์สำหรับนักจิตวิทยา - อ.: สถาบันจิตวิทยาและสังคมแห่งมอสโก: Flinta, 2003.336p

3. คอร์นิโลวา ทีวี การทดลองทางจิตวิทยาเบื้องต้น หนังสือเรียนสำหรับมหาวิทยาลัย อ.: สำนักพิมพ์ CheRo, 2544.