การประมวลผลข้อมูลเชิงสถิติ การประมวลผลข้อมูลทางสถิติ คำจำกัดความของการประมวลผลข้อมูลทางสถิติ
สไลด์ 2
- สถิติเป็นวิทยาศาสตร์ที่แน่นอนที่ศึกษาวิธีการรวบรวม วิเคราะห์ และประมวลผลข้อมูลที่อธิบายการกระทำ ปรากฏการณ์ และกระบวนการของมวล
- สถิติทางคณิตศาสตร์เป็นสาขาหนึ่งของคณิตศาสตร์ที่ศึกษาวิธีการรวบรวม การจัดระบบ และการประมวลผลผลลัพธ์ของการสังเกตปรากฏการณ์มวลแบบสุ่ม เพื่อระบุรูปแบบที่มีอยู่
สไลด์ 3
การศึกษาสถิติ
- จำนวนกลุ่มประชากรแต่ละกลุ่มของประเทศและภูมิภาค
- การผลิตและการบริโภคผลิตภัณฑ์ประเภทต่างๆ
- การขนส่งสินค้าและคนโดยสารด้วยการขนส่งรูปแบบต่างๆ
- ทรัพยากรธรรมชาติ และอื่นๆ อีกมากมาย
- ผลการศึกษาทางสถิติถูกนำมาใช้กันอย่างแพร่หลายในการสรุปเชิงปฏิบัติและเชิงวิทยาศาสตร์
- ปัจจุบันเริ่มมีการศึกษาสถิติแล้วใน มัธยมในมหาวิทยาลัย นี่เป็นวิชาบังคับ เนื่องจากมีความเกี่ยวข้องกับวิทยาศาสตร์และสาขาวิชาต่างๆ มากมาย
- เพื่อเพิ่มจำนวนการขายในร้านค้า เพื่อปรับปรุงคุณภาพความรู้ในโรงเรียน เพื่อขับเคลื่อนประเทศไปสู่การเติบโตทางเศรษฐกิจ จำเป็นต้องทำการศึกษาทางสถิติและหาข้อสรุปที่เหมาะสม และทุกคนควรจะสามารถทำเช่นนี้ได้
สไลด์ 4
เป้าหมายหลักของการศึกษาองค์ประกอบของสถิติ
- การก่อตัวของทักษะในการประมวลผลข้อมูลทางสถิติเบื้องต้น
- ภาพและการวิเคราะห์ข้อมูลเชิงปริมาณที่นำเสนอในรูปแบบต่างๆ (ในรูปของตาราง แผนภาพ กราฟของการพึ่งพาจริง)
- การพัฒนาแนวคิดเกี่ยวกับแนวคิดทางสถิติที่สำคัญ ได้แก่ แนวคิดเรื่องการประมาณค่าและแนวคิดในการทดสอบสมมติฐานทางสถิติ
- พัฒนาความสามารถในการเปรียบเทียบความน่าจะเป็นของเหตุการณ์สุ่มที่เกิดขึ้นกับผลการทดลองเฉพาะ
สไลด์ 5
- ชุดข้อมูล
- ปริมาณชุดข้อมูล
- ช่วงของชุดข้อมูล
- โหมดชุดข้อมูล
- ค่ามัธยฐานของซีรีส์
- เฉลี่ย
- สั่งซื้อชุดข้อมูล
- ตารางการกระจายข้อมูล
- มาสรุปกัน
- ชุดข้อมูลการเสนอชื่อ
- ความถี่ผลลัพธ์
- ความถี่เปอร์เซ็นต์
- การจัดกลุ่มข้อมูล
- วิธีการประมวลผลข้อมูล
- มาสรุปกัน
สไลด์ 6
คำนิยาม
- ชุดข้อมูลคือชุดผลลัพธ์ของการวัดบางอย่าง
- ตัวอย่างเช่น:1) การวัดส่วนสูงของมนุษย์
- 2) การวัดน้ำหนักมนุษย์ (สัตว์)
- 3) ค่ามิเตอร์ (ไฟฟ้า, น้ำ, ความร้อน...)
- 4) ผลการแข่งขันในระยะ 100 เมตร
- ฯลฯ
สไลด์ 7
- ปริมาณของชุดข้อมูลคือปริมาณของข้อมูลทั้งหมด
- ตัวอย่างเช่น ให้ชุดตัวเลข 1; 3; 6; -4; 0
- ปริมาตรของมันจะเท่ากับ 5 ทำไม?
สไลด์ 8
ทำงานให้เสร็จ
- กำหนดระดับเสียงของซีรี่ส์นี้
- คำตอบ: 10
สไลด์ 9
คำนิยาม
- พิสัยคือความแตกต่างระหว่างตัวเลขที่ใหญ่ที่สุดและน้อยที่สุดในชุดข้อมูล
- ตัวอย่างเช่น: หากได้รับชุดตัวเลข 1; 3; 6; -4; 0; 2 ดังนั้นช่วงของชุดข้อมูลนี้จะเท่ากับ 6 (เนื่องจาก 6 - 0 = 6)
สไลด์ 10
ทำงานให้เสร็จ
- ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่สอดคล้องกัน: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5
- กำหนดช่วงของซีรี่ส์นี้
- คำตอบ: 3
สไลด์ 11
คำนิยาม
- โหมดของชุดข้อมูลคือจำนวนชุดข้อมูลที่เกิดขึ้นบ่อยที่สุดในชุดข้อมูลนี้
- ชุดข้อมูลอาจมีหรือไม่มีโหมด
- ดังนั้น ในชุดข้อมูล 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 แต่ละหมายเลข 47 และ 52 เกิดขึ้นสองครั้ง และตัวเลขที่เหลือน้อยกว่าสองครั้ง ในกรณีเช่นนี้ มีการตกลงกันว่าซีรีส์นี้มีสองโหมด: 47 และ 52
สไลด์ 12
ทำงานให้เสร็จ
- ดังนั้นในชุดข้อมูล
- 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 แต่ละหมายเลขของ 47 และ 52 ปรากฏขึ้นสองครั้ง และหมายเลขที่เหลือน้อยกว่าสองครั้ง ในกรณีเช่นนี้ มีการตกลงกันว่าซีรีส์นี้มีสองโหมด: 47 และ 52
- ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่เหมาะสม:
- 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
- กำหนดโหมดของซีรีย์นี้
- คำตอบ: 4
สไลด์ 13
คำนิยาม
- ค่ามัธยฐานที่มีพจน์เป็นเลขคี่คือตัวเลขที่เขียนไว้ตรงกลาง
- ค่ามัธยฐานที่มีพจน์เป็นจำนวนคู่คือค่าเฉลี่ยเลขคณิตของตัวเลขสองตัวที่เขียนไว้ตรงกลาง
- ตัวอย่างเช่น กำหนดค่ามัธยฐานของชุดตัวเลข
- 16; -4; 5; -2; -3; 3; 3; -2; 3. คำตอบ: -3
- 2) -1; 0; 2; 1; -1; 0;2; -1. คำตอบ: 0
สไลด์ 14
ทำงานให้เสร็จ
- ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่สอดคล้องกัน: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5
- กำหนดค่ามัธยฐานของซีรี่ส์นี้
- คำตอบ: 4
สไลด์ 15
คำนิยาม
- ค่าเฉลี่ยเลขคณิตคือผลหารของการหารผลรวมของตัวเลขในชุดข้อมูลด้วยตัวเลข
- ตัวอย่างเช่น ให้ชุดตัวเลข -1; 0; 2; 1; -1; 0; 2; -1. จากนั้นค่าเฉลี่ยเลขคณิตจะเท่ากับ: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0.25
สไลด์ 16
ทำงานให้เสร็จ
- ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่สอดคล้องกัน: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5
- หาค่าเฉลี่ยเลขคณิตของอนุกรมนี้
- คำตอบ: 3.9
สไลด์ 17
การปฏิบัติงาน
- การมอบหมาย: อธิบายลักษณะผลงานของนักเรียน Ivanov ในวิชาคณิตศาสตร์สำหรับไตรมาสที่สี่
- เสร็จสิ้นการทำงาน:
- 1.การรวบรวมข้อมูล:
- เกรดที่เขียนจากนิตยสารคือ: 5,4,5,3,3,5,4,4,4
- 2.การประมวลผลข้อมูลที่ได้รับ:
- ปริมาณ = 9
- ช่วง = 5 - 3 = 2
- แฟชั่น = 4
- ค่ามัธยฐาน = 3
- ค่าเฉลี่ยเลขคณิต =(5+4+5+3+3+5+4+4+4) : 9 กลับไปยัง 4
- ลักษณะของผลการเรียน: นักเรียนไม่พร้อมสำหรับบทเรียนเสมอไป
- ส่วนใหญ่เขาเรียนด้วยเกรด "4" หนึ่งในสี่ออกมาเป็น "4"
สไลด์ 18
ด้วยตัวเอง
- เราจำเป็นต้องค้นหาปริมาตรของอนุกรม ช่วงของอนุกรม โหมด ค่ามัธยฐาน และค่าเฉลี่ยเลขคณิต:
- การ์ด 1. 22.5; 23; 21.5; 22; 23.
- การ์ด 2.6; -4; 5; -2; -3; 3; 3; -2; 3.
- ใบที่ 3 12.5; 12; 12; 12.5; 13; 12.5; 13.
- การ์ด 4. -1; 0; 2; 1; -1; 0; 2; -1.
- การ์ด 5. 125; 130; 124; 131.
- การ์ด 6. 120; 100; 110.
สไลด์ 19
มาตรวจสอบกัน
- การ์ด 1.
- ปริมาณแถว = 5
- ช่วงของแถว = 10
- แฟชั่น = 23
- มัธยฐาน = 21.5
- ค่าเฉลี่ยเลขคณิต = 13.3
- การ์ด 3.
- ปริมาณแถว = 7
- ช่วงของอนุกรม = 1
- โหมด = 12.5
- มัธยฐาน = 12.5
- ค่าเฉลี่ยเลขคณิต = 12.5
- การ์ด 2.
- ปริมาณแถว = 9
- ช่วงของแถว = 10
- แฟชั่น = 3
- ค่ามัธยฐาน = -3
- ค่าเฉลี่ยเลขคณิต = 1
- การ์ด 4.
- ปริมาณแถว = 8
- ช่วงของแถว = 3
- โหมด = -1
- ค่ามัธยฐาน = 0
- ค่าเฉลี่ยเลขคณิต = 0.25
สไลด์ 20
- การ์ด 5.
- ปริมาณแถว = 4
- ช่วงแถว = 7
- แฟชั่น = ไม่
- มัธยฐาน = 127
- ค่าเฉลี่ยเลขคณิต = 127.5
- การ์ด 6.
- ปริมาณแถว = 3
- ช่วงช่วง = 20
- แฟชั่น = ไม่
- มัธยฐาน = 100
- ค่าเฉลี่ยเลขคณิต = 110
สไลด์ 21
คำนิยาม
- ชุดข้อมูลที่เรียงลำดับคือชุดข้อมูลที่มีการจัดเรียงตามกฎบางอย่าง
- จะจัดเรียงชุดตัวเลขได้อย่างไร? (เขียนตัวเลขให้แต่ละตัวเลขต่อมาไม่น้อย (ไม่มาก) กว่าตัวเลขก่อนหน้า) หรือเขียนชื่อบางชื่อ "ตามลำดับตัวอักษร"...
สไลด์ 22
ทำงานให้เสร็จ
- รับชุดตัวเลข:
- -1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1
- เรียงตามลำดับเลขจากน้อยไปมาก
- สารละลาย:
- -3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3
- ผลลัพธ์ที่ได้คือซีรีย์ที่สั่ง ข้อมูลเองไม่ได้เปลี่ยนแปลง มีเพียงลำดับที่ปรากฏเท่านั้นที่เปลี่ยนแปลง
สไลด์ 23
คำนิยาม
- ตารางการกระจายข้อมูลคือตารางของอนุกรมที่เรียงลำดับซึ่งแทนที่จะทำซ้ำตัวเลขเดียวกัน ระบบจะบันทึกจำนวนการซ้ำ
- ในทางกลับกัน หากทราบตารางการแจกจ่าย ก็จะสามารถรวบรวมข้อมูลตามลำดับได้
- ตัวอย่างเช่น:
- จากนั้นเราจะได้ซีรีย์ที่สั่งดังต่อไปนี้:
- -3;-3;-3;-1;-1;-1;-1;5;5;7;8;8;8;8;8
สไลด์ 24
ทำงานให้เสร็จ
- ในร้านขายรองเท้าสตรีแห่งหนึ่ง มีการวิจัยทางสถิติและรวบรวมตารางที่เกี่ยวข้องสำหรับราคารองเท้าและจำนวนยอดขาย:
- ราคา (ถู): 500 1200 1500 1800 2000 2500
- จำนวน: 8 9 14 15 3 1
- สำหรับตัวบ่งชี้เหล่านี้ คุณจะต้องค้นหาคุณลักษณะทางสถิติ:
- สร้างชุดข้อมูลตามลำดับ
- ปริมาณของชุดข้อมูล
- ช่วงซีรีส์
- ชุดแฟชั่น
- ค่ามัธยฐานของซีรีส์
- ค่าเฉลี่ยเลขคณิตของชุดข้อมูล
สไลด์ 25
และตอบคำถามต่อไปนี้
- จากหมวดราคาเหล่านี้ ร้านค้าไม่ควรขายรองเท้าที่ราคาใด
- รองเท้าควรแบ่งราคาเท่าไหร่?
- คุณควรตั้งเป้าหมายราคาเท่าไร?
สไลด์ 26
มาสรุปกัน
- เราคุ้นเคยกับแนวคิดเบื้องต้นว่าการประมวลผลข้อมูลทางสถิติเกิดขึ้นได้อย่างไร:
- ข้อมูลมักเป็นผลมาจากการวัดบางอย่างเสมอ
- ข้อมูลบางส่วนสามารถพบได้:
- ระดับเสียง ช่วง โหมด ค่ามัธยฐาน และ
- เฉลี่ย
- 3) ชุดข้อมูลใดก็ได้
- จัดระเบียบและเขียน
- ตารางการกระจายข้อมูล
สไลด์ 27
คำนิยาม
- ชุดข้อมูลที่ระบุชื่อไม่ใช่ข้อมูลเชิงตัวเลข แต่เช่น ชื่อ ชื่อ; การเสนอชื่อ...
- ตัวอย่างเช่น: รายชื่อผู้เข้ารอบสุดท้ายของฟุตบอลโลกตั้งแต่ปี 1930: อาร์เจนตินา, เชโกสโลวาเกีย, ฮังการี, บราซิล, ฮังการี, สวีเดน, เชโกสโลวะเกีย, เยอรมนี, อิตาลี, เนเธอร์แลนด์, เนเธอร์แลนด์, เยอรมนี, เยอรมนี,
- อาร์เจนตินา อิตาลี บราซิล เยอรมนี ฝรั่งเศส
สไลด์ 28
ทำงานให้เสร็จ
- ค้นหาจากตัวอย่างก่อนหน้า:
- ปริมาณของแถวที่ 2) โหมดของแถว
- 3) สร้างตารางการแจกจ่าย
- วิธีแก้ไข: ปริมาตร = 18; แฟชั่น – ทีมเยอรมัน.
งานห้องปฏิบัติการหมายเลข 3 การประมวลผลข้อมูลทางสถิติในระบบ MatLab
คำแถลงทั่วไปของปัญหา
วัตถุประสงค์หลักของการดำเนินการ งานห้องปฏิบัติการคือการทำความคุ้นเคยกับพื้นฐานของการทำงานกับการประมวลผลข้อมูลทางสถิติในสภาพแวดล้อม MatLAB
ส่วนทางทฤษฎี
การประมวลผลข้อมูลทางสถิติเบื้องต้น
การประมวลผลข้อมูลทางสถิติขึ้นอยู่กับวิธีเชิงปริมาณหลักและรอง วัตถุประสงค์ของการประมวลผลข้อมูลทางสถิติเบื้องต้นคือเพื่อจัดโครงสร้างข้อมูลที่ได้รับ ซึ่งเกี่ยวข้องกับการจัดกลุ่มข้อมูลลงในตารางสรุปตามพารามิเตอร์ต่างๆ ข้อมูลปฐมภูมิจะต้องนำเสนอในรูปแบบที่ช่วยให้บุคคลสามารถประเมินชุดข้อมูลที่ได้โดยประมาณ และเพื่อระบุข้อมูลเกี่ยวกับการกระจายข้อมูลของตัวอย่างข้อมูลที่เป็นผล เช่น ความสม่ำเสมอหรือความกะทัดรัดของข้อมูล หลังจากการวิเคราะห์ข้อมูลหลักแล้ว จะใช้วิธีการประมวลผลข้อมูลทางสถิติรอง โดยพิจารณาจากรูปแบบทางสถิติในชุดข้อมูลที่มีอยู่
การดำเนินการวิเคราะห์ทางสถิติเบื้องต้นในอาร์เรย์ข้อมูลช่วยให้คุณได้รับความรู้เกี่ยวกับสิ่งต่อไปนี้:
ค่าใดที่เป็นค่าปกติมากที่สุดสำหรับตัวอย่าง เพื่อตอบคำถามนี้ จึงมีการกำหนดการวัดแนวโน้มจากส่วนกลาง
การแพร่กระจายของข้อมูลมีขนาดใหญ่เพียงใดเมื่อเทียบกับค่าคุณลักษณะนี้ เช่น "ความคลุมเครือ" ของข้อมูลคืออะไร ใน ในกรณีนี้มีการกำหนดมาตรการวัดความแปรปรวน
เป็นที่น่าสังเกตว่าตัวบ่งชี้ทางสถิติของแนวโน้มและความแปรปรวนส่วนกลางนั้นพิจารณาจากข้อมูลเชิงปริมาณเท่านั้น
มาตรการแนวโน้มส่วนกลาง– กลุ่มของค่าที่ข้อมูลส่วนที่เหลือถูกจัดกลุ่ม ดังนั้น การวัดแนวโน้มส่วนกลางจะสรุปอาร์เรย์ของข้อมูลซึ่งทำให้สามารถสร้างข้อสรุปทั้งเกี่ยวกับตัวอย่างโดยรวมและดำเนินการ การวิเคราะห์เปรียบเทียบตัวอย่างที่แตกต่างกันซึ่งกันและกัน
สมมติว่าเรามีตัวอย่างข้อมูล การวัดแนวโน้มส่วนกลางจะได้รับการประเมินโดยตัวบ่งชี้ต่อไปนี้:
1. ค่าเฉลี่ยตัวอย่างคือผลลัพธ์ของการหารผลรวมของค่าตัวอย่างทั้งหมดด้วยจำนวนที่กำหนดโดยสูตร (3.1)
(3.1)
ที่ไหน - ฉันองค์ประกอบที่ 3 ของการเลือก
n– จำนวนองค์ประกอบตัวอย่าง
ค่าเฉลี่ยตัวอย่างให้ความแม่นยำสูงสุดในกระบวนการประมาณค่าแนวโน้มจากศูนย์กลาง
สมมติว่าเรามีกลุ่มตัวอย่างจำนวน 20 คน. องค์ประกอบตัวอย่างเป็นข้อมูลเกี่ยวกับรายได้เฉลี่ยต่อเดือนของแต่ละคน สมมติว่า 19 คนมีรายได้เฉลี่ยต่อเดือน 20,000 รูเบิล และ 1 คนที่มีรายได้ 300 ตัน รายได้รวมต่อเดือนของกลุ่มตัวอย่างทั้งหมดคือ 680 รูเบิล ค่าเฉลี่ยตัวอย่างในกรณีนี้คือ S=34
2. ค่ามัธยฐาน– สร้างค่าด้านบนและด้านล่างซึ่งจำนวนค่าที่แตกต่างกันจะเท่ากัน กล่าวคือ นี่คือค่ากลางในชุดข้อมูลตามลำดับ กำหนดโดยขึ้นอยู่กับจำนวนองค์ประกอบที่เป็นคู่/คี่ในตัวอย่างโดยใช้สูตร (3.2) หรือ (3.3) อัลกอริทึมสำหรับการประมาณค่ามัธยฐานสำหรับตัวอย่างข้อมูล:
ประการแรก ข้อมูลจะถูกจัดอันดับ (เรียงลำดับ) จากมากไปน้อย/จากน้อยไปหามาก
หากตัวอย่างที่สั่งมีจำนวนองค์ประกอบเป็นเลขคี่ ค่ามัธยฐานจะตรงกับค่ากลาง
(3.2)
ที่ไหน n
ในกรณีขององค์ประกอบจำนวนคู่ ค่ามัธยฐานจะถูกกำหนดให้เป็นค่าเฉลี่ยเลขคณิตของค่ากลางทั้งสองค่า
(3.3)
องค์ประกอบเฉลี่ยของตัวอย่างที่สั่งอยู่ที่ไหน
- องค์ประกอบของการเลือกคำสั่งถัดจาก ;
จำนวนองค์ประกอบตัวอย่าง
หากองค์ประกอบตัวอย่างทั้งหมดแตกต่างกัน องค์ประกอบตัวอย่างครึ่งหนึ่งจะมีค่ามากกว่าค่ามัธยฐาน และอีกครึ่งหนึ่งจะน้อยกว่า ตัวอย่างเช่น สำหรับกลุ่มตัวอย่าง (1, 5, 9, 15, 16) ค่ามัธยฐานจะเท่ากับองค์ประกอบ 9
ในการวิเคราะห์ข้อมูลทางสถิติ ค่ามัธยฐานจะช่วยระบุองค์ประกอบตัวอย่างที่มีอิทธิพลอย่างมากต่อค่าของค่าเฉลี่ยตัวอย่าง
สมมติว่าเรามีกลุ่มตัวอย่างจำนวน 20 คน. องค์ประกอบตัวอย่างเป็นข้อมูลเกี่ยวกับรายได้เฉลี่ยต่อเดือนของแต่ละคน สมมติว่า 19 คนมีรายได้เฉลี่ยต่อเดือน 20,000 รูเบิล และ 1 คนที่มีรายได้ 300 ตัน รายได้รวมต่อเดือนของกลุ่มตัวอย่างทั้งหมดคือ 680 รูเบิล ค่ามัธยฐานหลังจากสั่งตัวอย่าง จะถูกกำหนดให้เป็นค่าเฉลี่ยเลขคณิตขององค์ประกอบที่สิบและสิบเอ็ดของกลุ่มตัวอย่าง) และเท่ากับ Me = 20 tr ผลลัพธ์นี้ตีความดังนี้: ค่ามัธยฐานแบ่งกลุ่มตัวอย่างออกเป็นสองกลุ่มเพื่อสรุปได้ว่าในกลุ่มแรกแต่ละคนมีรายได้เฉลี่ยต่อเดือนไม่เกิน 20,000 รูเบิลและในกลุ่มที่สองไม่น้อยกว่า 20,000 รูเบิล . ใน ในตัวอย่างนี้เราสามารถพูดได้ว่าค่ามัธยฐานนั้นมีลักษณะเฉพาะที่บุคคล "โดยเฉลี่ย" มีรายได้เท่าใด แม้ว่าค่าของค่าเฉลี่ยตัวอย่างจะเกินอย่างมีนัยสำคัญ S=34 ซึ่งบ่งชี้ถึงการยอมรับไม่ได้ของคุณลักษณะนี้เมื่อประเมินรายได้เฉลี่ย
ดังนั้น ยิ่งความแตกต่างระหว่างค่ามัธยฐานและค่าเฉลี่ยตัวอย่างมากเท่าใด การกระจายตัวของข้อมูลตัวอย่างก็จะยิ่งมากขึ้นเท่านั้น (ในตัวอย่างที่พิจารณา บุคคลที่มีรายได้ 300 รูเบิลจะแตกต่างจากคนทั่วไปในกลุ่มตัวอย่างเฉพาะอย่างชัดเจนและมีนัยสำคัญ กระทบต่อประมาณการรายได้เฉลี่ย) จะทำอย่างไรกับองค์ประกอบดังกล่าวจะถูกตัดสินใจในแต่ละกรณี แต่ในกรณีทั่วไป เพื่อให้มั่นใจในความน่าเชื่อถือของกลุ่มตัวอย่าง พวกเขาจะถูกลบออก เนื่องจากมีอิทธิพลอย่างมากต่อการประเมินตัวบ่งชี้ทางสถิติ
3. แฟชั่น (โม)– สร้างค่าที่เกิดขึ้นบ่อยที่สุดในตัวอย่าง เช่น ค่าที่มีความถี่สูงสุด อัลกอริธึมการประมาณค่าโหมด:
ในกรณีที่ตัวอย่างมีองค์ประกอบที่เกิดขึ้นบ่อยครั้งเท่ากัน กล่าวกันว่าไม่มีโหมดในตัวอย่างนี้
ถ้าสอง องค์ประกอบใกล้เคียงตัวอย่างมีความถี่เท่ากัน ซึ่งมากกว่าความถี่ขององค์ประกอบที่เหลือของตัวอย่าง จากนั้นโหมดจะถูกกำหนดให้เป็นค่าเฉลี่ยของทั้งสองค่านี้
หากองค์ประกอบตัวอย่างสองรายการมีความถี่เท่ากัน ซึ่งมากกว่าความถี่ขององค์ประกอบตัวอย่างที่เหลือ และองค์ประกอบเหล่านี้ไม่ได้อยู่ติดกัน ตัวอย่างจะมีสองโหมด
โหมดในการวิเคราะห์ทางสถิติใช้ในสถานการณ์ที่จำเป็นต้องมีการประเมินการวัดแนวโน้มจากส่วนกลางอย่างรวดเร็ว และไม่จำเป็นต้องมีความแม่นยำสูง ตัวอย่างเช่น แฟชั่น (ตามขนาดหรือแบรนด์) สามารถใช้เพื่อระบุเสื้อผ้าและรองเท้าที่เป็นที่ต้องการของลูกค้ามากที่สุดได้อย่างสะดวก
การวัดการกระจาย (ความแปรปรวน)– กลุ่มตัวบ่งชี้ทางสถิติที่แสดงลักษณะความแตกต่างระหว่างค่าตัวอย่างแต่ละค่า จากตัวบ่งชี้การวัดการกระจายตัว สามารถประเมินระดับความเป็นเนื้อเดียวกันและความแน่นขององค์ประกอบตัวอย่างได้ การวัดการกระจายตัวมีลักษณะเฉพาะโดยชุดตัวบ่งชี้ต่อไปนี้:
1. พิสัย -นี่คือช่วงเวลาระหว่างค่าสูงสุดและต่ำสุดของผลการสังเกต (องค์ประกอบตัวอย่าง) ตัวบ่งชี้ช่วงบ่งชี้การกระจายของค่าในชุดข้อมูล หากช่วงมีขนาดใหญ่ ค่าในผลรวมจะกระจัดกระจายมาก มิฉะนั้น (ช่วงจะน้อย) ว่ากันว่าค่าในผลรวมนั้นอยู่ใกล้กัน ช่วงถูกกำหนดโดยสูตร (3.4)
(3.4)
ที่ไหน - องค์ประกอบตัวอย่างสูงสุด
- องค์ประกอบตัวอย่างขั้นต่ำ
2.ส่วนเบี่ยงเบนเฉลี่ย– ผลต่างของค่าเฉลี่ยเลขคณิต (ในค่าสัมบูรณ์) ระหว่างแต่ละค่าในกลุ่มตัวอย่างกับค่าเฉลี่ยของกลุ่มตัวอย่าง ค่าเบี่ยงเบนเฉลี่ยถูกกำหนดโดยสูตร (3.5)
(3.5)
ที่ไหน - ฉันองค์ประกอบที่ 3 ของการเลือก
ค่าเฉลี่ยตัวอย่างคำนวณโดยใช้สูตร (3.1)
จำนวนองค์ประกอบตัวอย่าง
โมดูล จำเป็นเนื่องจากการเบี่ยงเบนจากค่าเฉลี่ยสำหรับแต่ละองค์ประกอบเฉพาะสามารถเป็นได้ทั้งบวกและลบ ดังนั้น หากคุณไม่เลือกโมดูล ผลรวมของการเบี่ยงเบนทั้งหมดจะเข้าใกล้ศูนย์ และจะเป็นไปไม่ได้ที่จะตัดสินระดับของความแปรปรวนของข้อมูล (การอัดแน่นของข้อมูลรอบๆ ค่าเฉลี่ยตัวอย่าง) เมื่อทำการวิเคราะห์ทางสถิติ อาจใช้โหมดและค่ามัธยฐานแทนค่าเฉลี่ยตัวอย่าง
3. การกระจายตัว- การวัดการกระจายตัวที่อธิบายค่าเบี่ยงเบนเปรียบเทียบระหว่างค่าข้อมูลและค่าเฉลี่ย คำนวณเป็นผลรวมของค่าเบี่ยงเบนกำลังสองของแต่ละองค์ประกอบตัวอย่างจากค่าเฉลี่ย ความแปรปรวนจะถูกประมาณไว้ ขึ้นอยู่กับขนาดของกลุ่มตัวอย่าง วิธีทางที่แตกต่าง:
สำหรับตัวอย่างขนาดใหญ่ (n>30) ตามสูตร (3.6)
(3.6)
สำหรับตัวอย่างขนาดเล็ก (n<30) по формуле (3.7)
(3.7)
โดยที่ X i คือองค์ประกอบตัวอย่างที่ i
S – ค่าเฉลี่ยตัวอย่าง;
จำนวนองค์ประกอบตัวอย่าง
(X i – S) - ส่วนเบี่ยงเบนจากค่าเฉลี่ยสำหรับแต่ละค่าของชุดข้อมูล
4. ส่วนเบี่ยงเบนมาตรฐาน-การวัดว่าจุดข้อมูลที่กระจัดกระจายในวงกว้างสัมพันธ์กับค่าเฉลี่ยของจุดเหล่านั้นอย่างไร
กระบวนการยกกำลังสองส่วนเบี่ยงเบนส่วนบุคคลเมื่อคำนวณความแปรปรวนจะเพิ่มระดับความเบี่ยงเบนของการเบี่ยงเบนที่เกิดขึ้นจากการเบี่ยงเบนเดิม ซึ่งจะทำให้เกิดข้อผิดพลาดเพิ่มเติม ดังนั้น เพื่อให้การประมาณค่าการแพร่กระจายของจุดข้อมูลสัมพันธ์กับค่าเฉลี่ยใกล้กับค่าเบี่ยงเบนเฉลี่ย จึงต้องใช้รากที่สองของความแปรปรวน รากที่แยกออกมาของความแปรปรวนจะแสดงลักษณะเฉพาะของการวัดความแปรปรวนที่เรียกว่าค่าเฉลี่ยรากกำลังสองหรือส่วนเบี่ยงเบนมาตรฐาน (3.8)
(3.8)
สมมติว่าคุณเป็นผู้จัดการโครงการพัฒนาซอฟต์แวร์ คุณมีโปรแกรมเมอร์ห้าคนภายใต้คำสั่งของคุณ ด้วยการจัดการกระบวนการดำเนินโครงการ คุณจะกระจายงานระหว่างโปรแกรมเมอร์ เพื่อให้ตัวอย่างง่ายขึ้น เราจะดำเนินการต่อจากข้อเท็จจริงที่ว่างานมีความซับซ้อนและเวลาในการดำเนินการเท่ากัน คุณตัดสินใจวิเคราะห์งานของโปรแกรมเมอร์แต่ละคน (จำนวนงานที่เสร็จสมบูรณ์ในระหว่างสัปดาห์) ในช่วง 10 สัปดาห์ที่ผ่านมา ซึ่งส่งผลให้คุณได้รับตัวอย่างต่อไปนี้:
ชื่อสัปดาห์ | ||||||||||
โดยการประมาณจำนวนเฉลี่ยของงานที่เสร็จสมบูรณ์ คุณจะได้ผลลัพธ์ต่อไปนี้:
ชื่อสัปดาห์ | ส | ||||||||||
22,3 | |||||||||||
22,4 | |||||||||||
22,2 | |||||||||||
22,1 | |||||||||||
22,5 |
ตามตัวบ่งชี้ S โปรแกรมเมอร์ทุกคนทำงานโดยเฉลี่ยโดยมีประสิทธิภาพเท่ากัน (ประมาณ 22 งานต่อสัปดาห์) อย่างไรก็ตาม ตัวบ่งชี้ความแปรปรวน (ช่วง) นั้นสูงมาก (จาก 5 งานสำหรับโปรแกรมเมอร์ตัวที่สี่ถึง 24 งานสำหรับตัวที่ห้า)
ชื่อสัปดาห์ | ส | ป | ||||||||||
22,3 | ||||||||||||
22,4 | ||||||||||||
22,2 | ||||||||||||
22,1 | ||||||||||||
22,5 |
ลองประมาณค่าเบี่ยงเบนมาตรฐานซึ่งแสดงให้เห็นว่าค่าในกลุ่มตัวอย่างมีการกระจายอย่างไรสัมพันธ์กับค่าเฉลี่ย และโดยเฉพาะอย่างยิ่งในกรณีของเรา ให้ประมาณว่าการแพร่กระจายในการทำงานให้เสร็จสิ้นในแต่ละสัปดาห์มีขนาดใหญ่เพียงใด
ชื่อสัปดาห์ | ส | ป | ดังนั้น | ||||||||||
22,3 | 1,56 | ||||||||||||
22,4 | 1,8 | ||||||||||||
22,2 | 2,84 | ||||||||||||
22,1 | 1,3 | ||||||||||||
22,5 | 5,3 |
ผลการประมาณค่าส่วนเบี่ยงเบนมาตรฐานจะระบุสิ่งต่อไปนี้ (เราจะประเมินกรณีสุดโต่งสองกรณี โปรแกรมเมอร์ 4 และ 5):
แต่ละค่าในตัวอย่างโปรแกรมเมอร์ 4 คนเบี่ยงเบนโดยเฉลี่ย 1.3 ค่าจากค่าเฉลี่ย
แต่ละค่าในตัวอย่างโปรแกรมเมอร์ 5 เบี่ยงเบนโดยเฉลี่ย 5.3 รายการจากค่าเฉลี่ย
ยิ่งค่าเบี่ยงเบนมาตรฐานเข้าใกล้ 0 มากเท่าใด ค่าเฉลี่ยก็น่าเชื่อถือมากขึ้นเท่านั้น เนื่องจากค่าแต่ละค่าในกลุ่มตัวอย่างเกือบจะเท่ากับค่าเฉลี่ย (ในตัวอย่างของเราคือ 22.5 รายการ) ดังนั้นโปรแกรมเมอร์ 4 จึงมีความสอดคล้องมากที่สุด ไม่เหมือนโปรแกรมเมอร์ 5 ความแปรปรวนของการทำงานให้เสร็จสิ้นในแต่ละสัปดาห์สำหรับโปรแกรมเมอร์คนที่ 5 คือ 5.3 งาน ซึ่งบ่งบอกถึงการแพร่กระจายที่สำคัญ ในกรณีของโปรแกรมเมอร์คนที่ 5 ไม่สามารถเชื่อถือค่าเฉลี่ยได้ ดังนั้นจึงเป็นเรื่องยากที่จะคาดการณ์จำนวนงานที่เสร็จสมบูรณ์ในสัปดาห์หน้า ซึ่งจะทำให้ขั้นตอนการวางแผนและการยึดตามตารางงานมีความซับซ้อนยิ่งขึ้น ไม่สำคัญว่าคุณจะตัดสินใจด้านการจัดการอะไรในหลักสูตรนี้ สิ่งสำคัญคือคุณต้องได้รับการประเมินตามที่คุณสามารถตัดสินใจด้านการจัดการได้อย่างเหมาะสม
ดังนั้นจึงสามารถสรุปโดยทั่วไปได้ว่าค่าเฉลี่ยไม่ได้ประเมินข้อมูลอย่างถูกต้องเสมอไป ความถูกต้องของการประมาณค่าเฉลี่ยสามารถตัดสินได้จากค่าส่วนเบี่ยงเบนมาตรฐาน
วิธีการประมวลผลทางสถิติของผลการทดลองคือเทคนิคทางคณิตศาสตร์สูตรวิธีการคำนวณเชิงปริมาณด้วยความช่วยเหลือซึ่งตัวบ่งชี้ที่ได้รับระหว่างการทดลองสามารถสรุปได้ทั่วไปนำเข้าสู่ระบบโดยเปิดเผยรูปแบบที่ซ่อนอยู่ในตัวพวกเขา
เรากำลังพูดถึงรูปแบบของลักษณะทางสถิติที่มีอยู่ระหว่างตัวแปรที่ศึกษาในการทดลอง
ข้อมูล เป็นองค์ประกอบพื้นฐานที่จะจำแนกหรือจัดหมวดหมู่เพื่อวัตถุประสงค์ในการประมวลผล 26
วิธีการวิเคราะห์ทางคณิตศาสตร์ - สถิติบางวิธีทำให้สามารถคำนวณสิ่งที่เรียกว่าสถิติทางคณิตศาสตร์เบื้องต้นซึ่งระบุลักษณะการกระจายตัวอย่างข้อมูลได้เช่น:
ค่าเฉลี่ยตัวอย่าง
ความแปรปรวนตัวอย่าง
ค่ามัธยฐานและอื่น ๆ อีกจำนวนหนึ่ง
วิธีอื่นๆ ของสถิติทางคณิตศาสตร์ทำให้สามารถตัดสินพลวัตของการเปลี่ยนแปลงในสถิติตัวอย่างแต่ละรายการได้ เช่น
การวิเคราะห์ความแปรปรวน
การวิเคราะห์การถดถอย
เมื่อใช้วิธีการสุ่มตัวอย่างข้อมูลกลุ่มที่สาม เราสามารถตัดสินความสัมพันธ์ทางสถิติที่มีอยู่ระหว่างตัวแปรที่ศึกษาในการทดลองนี้ได้อย่างน่าเชื่อถือ:
การวิเคราะห์สหสัมพันธ์
การวิเคราะห์ปัจจัย
วิธีการเปรียบเทียบ
วิธีการวิเคราะห์ทางคณิตศาสตร์และสถิติทั้งหมดแบ่งตามอัตภาพออกเป็นประถมศึกษาและมัธยมศึกษา 27
วิธีการหลักคือวิธีการที่ใช้เพื่อให้ได้ตัวบ่งชี้ที่สะท้อนผลการวัดที่ทำในการทดลองโดยตรง
วิธีรองเรียกว่าวิธีการประมวลผลทางสถิติด้วยความช่วยเหลือซึ่งรูปแบบทางสถิติที่ซ่อนอยู่ในนั้นจะถูกเปิดเผยบนพื้นฐานของข้อมูลหลัก
วิธีการหลักในการประมวลผลทางสถิติได้แก่:
การหาค่าเฉลี่ยตัวอย่าง
ความแปรปรวนตัวอย่าง
แฟชั่นที่คัดสรร;
ค่ามัธยฐานตัวอย่าง
วิธีการรองมักประกอบด้วย:
การวิเคราะห์สหสัมพันธ์
การวิเคราะห์การถดถอย
วิธีเปรียบเทียบสถิติปฐมภูมิในกลุ่มตัวอย่างตั้งแต่ 2 ตัวอย่างขึ้นไป
พิจารณาวิธีคำนวณสถิติทางคณิตศาสตร์เบื้องต้นโดยเริ่มจากค่าเฉลี่ยตัวอย่าง
ค่าเฉลี่ยเลขคณิต – เป็นอัตราส่วนของผลรวมของค่าข้อมูลทั้งหมดต่อจำนวนเทอม 28
ค่าเฉลี่ยที่เป็นตัวบ่งชี้ทางสถิติแสดงถึงการประเมินคุณภาพทางจิตวิทยาโดยเฉลี่ยที่ศึกษาในการทดลอง
การประเมินนี้แสดงถึงระดับของการพัฒนาโดยรวมในกลุ่มวิชาที่ได้รับการตรวจทางจิตเวช ด้วยการเปรียบเทียบค่าเฉลี่ยของกลุ่มตัวอย่างตั้งแต่สองตัวอย่างขึ้นไปโดยตรง เราสามารถตัดสินระดับการพัฒนาสัมพัทธ์ของคุณภาพที่ประเมินในกลุ่มคนที่สร้างกลุ่มตัวอย่างเหล่านี้ได้
ค่าเฉลี่ยตัวอย่างถูกกำหนดโดยใช้สูตร 29 ต่อไปนี้:
โดยที่ x cf คือค่าเฉลี่ยตัวอย่างหรือค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง
n คือจำนวนวิชาในกลุ่มตัวอย่างหรือตัวบ่งชี้การวินิจฉัยทางจิตเวชส่วนตัวโดยพิจารณาจากค่าเฉลี่ยที่คำนวณ
x k - ค่าส่วนตัวของตัวบ่งชี้สำหรับแต่ละวิชา มีตัวบ่งชี้ทั้งหมด n ตัวดังนั้นดัชนี k ของตัวแปรนี้จึงรับค่าตั้งแต่ 1 ถึง n
∑ เป็นเครื่องหมายที่ยอมรับในวิชาคณิตศาสตร์ในการรวมค่าของตัวแปรที่อยู่ทางด้านขวาของเครื่องหมายนี้
การกระจายตัว คือการวัดการแพร่กระจายของข้อมูลสัมพันธ์กับค่าเฉลี่ย 30
ยิ่งความแปรปรวนมากเท่าใด ความเบี่ยงเบนหรือการแพร่กระจายของข้อมูลก็จะยิ่งมากขึ้นเท่านั้น มีการกำหนดเพื่อให้สามารถแยกความแตกต่างจากค่าอื่น ๆ ที่มีค่าเฉลี่ยเท่ากัน แต่มีการกระจายต่างกัน
ความแปรปรวนถูกกำหนดโดยสูตรต่อไปนี้:
ความแปรปรวนตัวอย่างอยู่ที่ไหน หรือเพียงแค่ความแปรปรวน
นิพจน์หมายความว่าสำหรับ xk ทั้งหมดตั้งแต่ตัวแรกจนถึงตัวสุดท้ายในตัวอย่างที่กำหนดให้ จำเป็นต้องคำนวณความแตกต่างระหว่างค่าบางส่วนและค่าเฉลี่ย จัดกำลังสองความแตกต่างเหล่านี้แล้วรวมเข้าด้วยกัน
n คือจำนวนวิชาในกลุ่มตัวอย่างหรือค่าหลักที่ใช้คำนวณความแปรปรวน
ค่ามัธยฐาน คือค่าของคุณลักษณะที่กำลังศึกษาโดยแบ่งกลุ่มตัวอย่างโดยเรียงลำดับตามค่าของคุณลักษณะนี้ครึ่งหนึ่ง
การรู้ค่ามัธยฐานมีประโยชน์ในการพิจารณาว่าการกระจายตัวของค่าบางส่วนของคุณลักษณะที่ศึกษานั้นมีความสมมาตรและใกล้เคียงกับการแจกแจงแบบปกติหรือไม่ ค่าเฉลี่ยและค่ามัธยฐานของการแจกแจงแบบปกติมักจะเท่ากันหรือต่างกันน้อยมาก
หากการกระจายตัวอย่างคุณลักษณะเป็นเรื่องปกติ ก็สามารถใช้วิธีการคำนวณทางสถิติรองตามการกระจายข้อมูลแบบปกติได้ มิฉะนั้นจะไม่สามารถทำได้เนื่องจากข้อผิดพลาดร้ายแรงอาจคืบคลานเข้าสู่การคำนวณ
แฟชั่น สถิติทางคณิตศาสตร์เบื้องต้นอีกประการหนึ่งและลักษณะของการกระจายข้อมูลการทดลอง Mode คือค่าเชิงปริมาณของคุณลักษณะที่กำลังศึกษา ซึ่งมักพบในตัวอย่าง
สำหรับการกระจายคุณสมบัติแบบสมมาตรรวมถึงการแจกแจงแบบปกติ ค่าโหมดจะตรงกับค่ากลางและค่ามัธยฐาน สำหรับการแจกแจงประเภทอื่นๆ ที่ไม่สมมาตร นี่ไม่ใช่เรื่องปกติ
วิธีการประมวลผลทางสถิติทุติยภูมิซึ่งกำหนดการเชื่อมต่อหรือการพึ่งพาโดยตรงระหว่างข้อมูลการทดลองสองชุดเรียกว่า วิธีการวิเคราะห์สหสัมพันธ์ มันแสดงให้เห็นว่าปรากฏการณ์หนึ่งมีอิทธิพลหรือเกี่ยวข้องกับปรากฏการณ์อื่นอย่างไรในพลวัตของมัน มีการพึ่งพาประเภทนี้อยู่ เช่น ระหว่างปริมาณที่อยู่ในความสัมพันธ์ระหว่างเหตุและผลซึ่งกันและกัน หากปรากฏว่าปรากฏการณ์ทั้งสองมีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติ และหากมีความมั่นใจว่าปรากฏการณ์หนึ่งสามารถเป็นสาเหตุของอีกปรากฏการณ์หนึ่งได้ สรุปได้ว่า มีความสัมพันธ์ระหว่างเหตุและผลอย่างแน่นอน ดังต่อไปนี้
วิธีการนี้มีหลายประเภท:
การวิเคราะห์ความสัมพันธ์เชิงเส้นทำให้คุณสามารถสร้างการเชื่อมต่อโดยตรงระหว่างตัวแปรตามค่าสัมบูรณ์ได้ การเชื่อมต่อเหล่านี้แสดงเป็นเส้นตรงแบบกราฟิก จึงเป็นที่มาของชื่อ "เชิงเส้น"
ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นถูกกำหนดโดยใช้สูตรต่อไปนี้ 31:
ที่ไหน r xy - สัมประสิทธิ์สหสัมพันธ์เชิงเส้น
เอ็กซ์ ย -ค่าตัวอย่างเฉลี่ยของค่าที่เปรียบเทียบ
เอ็กซ์ ฉัน ,ย ฉัน - ค่าตัวอย่างส่วนตัวของปริมาณที่เปรียบเทียบ
พี -จำนวนค่าทั้งหมดในชุดตัวบ่งชี้ที่เปรียบเทียบ
การกระจายตัวการเบี่ยงเบนของค่าที่เปรียบเทียบจากค่าเฉลี่ย
ความสัมพันธ์ของอันดับเป็นตัวกำหนดการพึ่งพาไม่ได้ระหว่างค่าสัมบูรณ์ของตัวแปร แต่ระหว่างตำแหน่งลำดับหรืออันดับที่ถูกครอบครองโดยพวกมันในชุดเรียงลำดับตามค่า สูตรสำหรับค่าสัมประสิทธิ์สหสัมพันธ์อันดับมีดังนี้ 32:
โดยที่ R s คือสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมน
ง ฉัน - ความแตกต่างระหว่างอันดับตัวบ่งชี้ของวิชาเดียวกันตามลำดับ
พี -จำนวนวิชาหรือข้อมูลดิจิทัล (อันดับ) ในชุดที่สัมพันธ์กัน
วัตถุประสงค์ของบทเรียน:
- การสร้างเงื่อนไขสำหรับการเรียนรู้หัวข้อในระดับความเข้าใจและการท่องจำเบื้องต้น
- เพื่อพัฒนาความสามารถทางคณิตศาสตร์ของบุคลิกภาพของนักเรียน
วัตถุประสงค์ของบทเรียน
เกี่ยวกับการศึกษา:สร้างแนวคิดทางสถิติในฐานะวิทยาศาสตร์ ทำให้นักเรียนคุ้นเคยกับแนวคิดเกี่ยวกับลักษณะทางสถิติพื้นฐาน พัฒนาความสามารถในการค้นหาช่วงและโหมดของซีรีส์ วิเคราะห์ข้อมูล และพัฒนาทักษะการคำนวณทางจิต
เกี่ยวกับการศึกษา:ส่งเสริมการเรียนรู้แนวคิดและการตีความ การพัฒนาทักษะเหนือวิชาในการวิเคราะห์ การเปรียบเทียบ การจัดระบบและลักษณะทั่วไป ดำเนินการสร้างภาษาประจำวิชาต่อไป ส่งเสริมการก่อตัวของความสามารถหลัก (ความรู้ความเข้าใจ ข้อมูล การสื่อสาร) ในขั้นตอนต่างๆ ของบทเรียน ส่งเสริมการสร้างภาพทางวิทยาศาสตร์ที่เป็นหนึ่งเดียวของโลกในหมู่นักเรียนโดยระบุความเชื่อมโยงแบบสหวิทยาการระหว่างสถิติและวิทยาศาสตร์ต่างๆ
เกี่ยวกับการศึกษา:ปลูกฝังความสนใจในเรื่องที่กำลังศึกษาวัฒนธรรมสารสนเทศ ความพร้อมในการปฏิบัติตามบรรทัดฐานและกฎเกณฑ์ที่เป็นที่ยอมรับโดยทั่วไป มีประสิทธิภาพและองค์กรสูง
เทคโนโลยีที่ใช้: เทคโนโลยีการเรียนรู้ที่เน้นผู้เรียนเป็นศูนย์กลาง เทคโนโลยีสารสนเทศและการสื่อสาร
อุปกรณ์ที่จำเป็น, วัสดุ: โปรเจคเตอร์มัลติมีเดีย คอมพิวเตอร์ ไวท์บอร์ดแบบโต้ตอบ
ในระหว่างเรียน
1. ช่วงเวลาขององค์กร
การตรวจสอบความพร้อมของนักเรียนในชั้นเรียน
การตรวจสอบการเข้าร่วม
2. การตั้งเป้าหมาย
เหตุผลความจำเป็นในการศึกษาหัวข้อนี้
ให้นักเรียนมีส่วนร่วมในกระบวนการกำหนดเป้าหมายบทเรียน
เราได้รับและรวบรวมข้อมูลจากแหล่งใด (คำตอบที่แนะนำ: วิทยุ โทรทัศน์ หนังสือพิมพ์ นิตยสาร โทรศัพท์ บุคคล อินเทอร์เน็ต จดหมาย)
ผู้คนเก็บข้อมูลไว้ที่ไหน? (คำตอบที่แนะนำ. : ในหน่วยความจำและสื่อภายนอก)
การเรียนที่โรงเรียนเทคนิคเกี่ยวกับการรับข้อมูลหรือไม่? ที่โรงเรียนคุณเรียนวิชาการศึกษาทั่วไป แต่เมื่อคุณเรียนที่โรงเรียนเทคนิค คุณจะได้อะไรอีกบ้าง (คำตอบที่แนะนำ: ส ความรู้ทางวิชาชีพ)ยิ่งเราเรียนรู้มากเท่าไร ข้อมูลในความทรงจำของเราก็จะยิ่งมีมากขึ้นเท่านั้น
วันนี้ผมขอเสนอข้อมูลอีกชิ้นหนึ่งให้กับคุณ คุณได้รับการฝึกอบรมให้เป็นผู้ปฏิบัติงานเหมืองแร่ คุณจะทำงานกับรถขุด EKG-8I ประสิทธิภาพของรถขุดนี้คืออะไร ตามคำขอของฉัน โรงงานได้ให้ข้อมูลต่อไปนี้แก่ฉัน (ประสิทธิภาพของรถขุด - ตาราง)
โดยเศษหิน (พันตัน) |
เพื่อนๆ ข้อมูลเยอะดีมั้ย? ข้อมูลทั้งหมดจะมีประโยชน์และมีคุณภาพสูงได้หรือไม่? เราควรทำอย่างไรเพื่อไม่ให้หลงเข้าไปในเขาวงกตของข้อมูล? (คำตอบที่คาดหวังของนักเรียน: “ต้องสามารถแยกข้อมูลที่เป็นประโยชน์และมีคุณภาพสูงออกจากข้อมูลที่มีคุณภาพต่ำได้”) เหล่านั้น. สามารถประมวลผลได้
สรุป: วันนี้ในบทเรียนเราจะเรียนรู้การประมวลผลข้อมูล
3. การจัดกิจกรรมเพื่อศึกษาเนื้อหาใหม่(นักเรียนจดบันทึกในสมุดบันทึกและทำงานที่ได้รับมอบหมายในระหว่างกระบวนการอธิบาย)
1. คำจำกัดความของสถิติ
สถิติคืออะไร? ว่ากันว่านายกรัฐมนตรีอังกฤษ เบนจามิน ดิสเรลี (พ.ศ. 2347 - 2424) ตอบคำถามนี้ดังนี้: "การโกหกมีสามประเภท: การโกหก การโกหกสาปแช่ง และสถิติ"
สถิติเป็นวิทยาศาสตร์ที่แน่นอนที่ศึกษาวิธีการรวบรวม วิเคราะห์ และประมวลผลข้อมูลที่อธิบายการกระทำ ปรากฏการณ์ และกระบวนการของมวล
(อ่านข้อความที่ตัดตอนมาจากนวนิยายเรื่อง "The Twelve Chairs" โดย Ilf และ Petrov
“ สถิติรู้ทุกอย่าง” เป็นที่รู้กันว่าพลเมืองโดยเฉลี่ยของสาธารณรัฐกินอาหารได้มากเพียงใดต่อปี: เป็นที่รู้กันว่ามีนักล่านักบัลเล่ต์กี่คน: เครื่องจักร, จักรยาน, อนุสาวรีย์, ประภาคารและจักรเย็บผ้าในประเทศ: ชีวิตเต็มอิ่มแค่ไหน ความกระตือรือร้น ความหลงใหล และความคิด มองเราจากตารางสถิติ!..”
ชื่อของมันมาจากคำภาษาละติน "สถานะ" - รัฐจากรากนี้คำว่า stato (อิตาลี), statistik (เยอรมัน), รัฐ (อังกฤษ) - รัฐ
การศึกษาสถิติ:
เป้าหมายหลักของการศึกษาองค์ประกอบของสถิติ:
- จำนวนกลุ่มประชากรแต่ละกลุ่มของประเทศและภูมิภาค
- การผลิตและการบริโภคผลิตภัณฑ์ประเภทต่างๆ
- การขนส่งสินค้าและคนโดยสารด้วยการขนส่งรูปแบบต่างๆ
- ทรัพยากรธรรมชาติ และอื่นๆ อีกมากมาย
คุณรู้หรือไม่ว่าการปฏิบัติทางสถิติในประเทศใดเริ่มต้นขึ้น (ในประเทศจีน) การสำรวจสำมะโนประชากรครั้งแรกของประเทศมีอายุย้อนกลับไปในศตวรรษที่ 5 II สหัสวรรษก่อนคริสต์ศักราช
ในศตวรรษที่ 19 มีความเป็นไปได้ที่จะประมวลผลข้อมูลโดยใช้สูตร กฎทางคณิตศาสตร์ และคุณลักษณะพิเศษ นี้?.... ( เสื่อ. สถิติ).
2. สถิติทางคณิตศาสตร์
สถิติทางคณิตศาสตร์เป็นสาขาวิชาคณิตศาสตร์ที่ศึกษาวิธีการรวบรวม จัดระบบ และประมวลผลผลการสังเกตปรากฏการณ์มวลสุ่มเพื่อระบุรูปแบบที่มีอยู่
แล้วทำไมดิสเรลีถึงเปรียบเทียบสถิติกับการโกหก? (ไม่มีการประมวลผลข้อมูลทางวิทยาศาสตร์ที่เข้มงวด ข้อมูลถูกตีความโดยใครก็ตามที่ต้องการ)
สถิติทางคณิตศาสตร์มีวิธีการประมวลผลข้อมูลที่เป็นสากล
นี่คือสิ่งที่ทำให้ฮีโร่ของภาพยนตร์เรื่อง "Office Romance" พูดคำต่อไปนี้เกี่ยวกับสถิติ ( ส่วนหนึ่งของภาพยนตร์เรื่อง "Office Romance").
สรุป: สถิตินำข้อมูลเข้าสู่ระบบ
3. การแสดงข้อมูลแบบกราฟิก
รูปหลายเหลี่ยมการกระจาย
ฮิสโตแกรมการกระจาย
แผนภูมิวงกลม
4.
ลักษณะการวัด
1. ชุดข้อมูลคือชุดผลลัพธ์ของการวัดใดๆ
ตัวอย่างเช่น: 1) การวัดความสูงของมนุษย์
2) การวัดน้ำหนักมนุษย์ (สัตว์)
3) ค่ามิเตอร์ (ไฟฟ้า, น้ำ, ความร้อน...)
4) ผลการแข่งขันในระยะ 100 เมตร
2. ปริมาตรของชุดข้อมูล - ปริมาตรของชุดข้อมูลคือจำนวนข้อมูลทั้งหมด
ตัวอย่างเช่น:ให้ชุดตัวเลข 1; 3; 6; -4; 0
ปริมาตรของมันจะเท่ากับ 5 ทำไม?
3. ช่วงของชุดข้อมูลคือความแตกต่างระหว่างตัวเลขที่ใหญ่ที่สุดและน้อยที่สุดจากชุดข้อมูล
ตัวอย่างเช่น:ถ้าได้รับชุดตัวเลข 1; 3; 6; -4; 0; 2 แล้ว ขอบเขตชุดข้อมูลนี้จะเท่ากับ 6 (เนื่องจาก 6 - 0 = 6)
4. โหมดของชุดข้อมูล - โหมดของชุดข้อมูลคือจำนวนชุดข้อมูลที่เกิดขึ้นบ่อยที่สุดในชุดข้อมูลนี้
ตัวอย่างเช่น: น Data Poison อาจมีหรือไม่มีโหมดก็ได้
ดังนั้น ในชุดข้อมูล 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 แต่ละหมายเลข 47 และ 52 เกิดขึ้นสองครั้ง และตัวเลขที่เหลือน้อยกว่าสองครั้ง ในกรณีเช่นนี้ มีการตกลงกันว่าซีรีส์นี้มีสองโหมด: 47 และ 52
5. ค่ามัธยฐานของซีรีส์
ค่ามัธยฐานที่มีพจน์เป็นเลขคี่คือตัวเลขที่เขียนไว้ตรงกลาง
ค่ามัธยฐานที่มีพจน์เป็นจำนวนคู่ - นี่คือค่าเฉลี่ยเลขคณิตของตัวเลขสองตัวที่เขียนไว้ตรงกลาง
ตัวอย่างเช่น: กำหนดค่ามัธยฐานของชุดตัวเลข
16; -4; 5; -2; -3; 3; 3; -2; 3. คำตอบ: -3
2) -1; 0; 2; 1; -1; 0;2; -1. คำตอบ: 0
6. ค่าเฉลี่ยเลขคณิตคือผลหารของการหารผลรวมของตัวเลขในชุดด้วยตัวเลข
ตัวอย่างเช่น: ให้ชุดตัวเลข -1; 0; 2; 1; -1; 0; 2; -1. จากนั้นค่าเฉลี่ยเลขคณิตจะเท่ากับ: (-1+0+2+1+(-1)+0+2+(-1)): 8 = 2: 8 = 0.25
4. การรวมเนื้อหาที่ศึกษา
ออกกำลังกาย:อธิบายลักษณะการปฏิบัติงานของนักเรียน Peter Ivanov ในวิชาคณิตศาสตร์สำหรับไตรมาสที่สี่
เสร็จสิ้นการทำงาน:
1. การรวบรวมข้อมูล:
เกรดที่เขียนจากนิตยสารคือ: 5,4,5,3,3,5,4,4,4
2. การประมวลผลข้อมูลที่ได้รับ:
การบรรยายครั้งที่ 12 วิธีการประมวลผลผลลัพธ์ทางสถิติ
วิธีการประมวลผลผลลัพธ์ทางสถิติเรียกว่าเทคนิคทางคณิตศาสตร์สูตรวิธีการคำนวณเชิงปริมาณด้วยความช่วยเหลือซึ่งตัวบ่งชี้ที่ได้รับระหว่างการทดลองสามารถสรุปได้นำเข้าสู่ระบบโดยเปิดเผยรูปแบบที่ซ่อนอยู่ในตัวพวกเขา เรากำลังพูดถึงรูปแบบของลักษณะทางสถิติที่มีอยู่ระหว่างตัวแปรที่ศึกษาในการทดลอง
1. วิธีการประมวลผลทางสถิติเบื้องต้นของผลการทดลอง
วิธีการวิเคราะห์ทางคณิตศาสตร์และสถิติทั้งหมดแบ่งออกเป็นระดับประถมศึกษาและมัธยมศึกษาตามอัตภาพ วิธีการหลักคือวิธีการที่ใช้เพื่อให้ได้ตัวบ่งชี้ที่สะท้อนผลการวัดที่ทำในการทดลองโดยตรง ดังนั้น โดยตัวบ่งชี้ทางสถิติหลัก เราหมายถึงตัวบ่งชี้ที่ใช้ในวิธีวินิจฉัยทางจิตเวชและเป็นผลมาจากการประมวลผลทางสถิติเบื้องต้นของผลการวินิจฉัยทางจิต วิธีรองเรียกว่าวิธีการประมวลผลทางสถิติด้วยความช่วยเหลือซึ่งรูปแบบทางสถิติที่ซ่อนอยู่ในนั้นจะถูกเปิดเผยบนพื้นฐานของข้อมูลหลัก
วิธีการหลักของการประมวลผลทางสถิติได้แก่ การหาค่าเฉลี่ยตัวอย่าง ความแปรปรวนของตัวอย่าง โหมดตัวอย่าง และค่ามัธยฐานของตัวอย่าง วิธีรองมักจะรวมถึงการวิเคราะห์สหสัมพันธ์ การวิเคราะห์การถดถอย และวิธีการเปรียบเทียบสถิติปฐมภูมิในกลุ่มตัวอย่างตั้งแต่สองตัวอย่างขึ้นไป
พิจารณาวิธีการคำนวณสถิติทางคณิตศาสตร์เบื้องต้น
แฟชั่นพวกเขาเรียกค่าเชิงปริมาณของคุณลักษณะที่กำลังศึกษาซึ่งมักพบในตัวอย่าง
ค่ามัธยฐานคือค่าของคุณลักษณะที่กำลังศึกษาโดยแบ่งกลุ่มตัวอย่างโดยเรียงลำดับตามค่าของคุณลักษณะนี้ครึ่งหนึ่ง
ค่าเฉลี่ยตัวอย่าง(ค่าเฉลี่ยเลขคณิต) เป็นตัวบ่งชี้ทางสถิติแสดงถึงการประเมินโดยเฉลี่ยของคุณภาพทางจิตวิทยาที่ศึกษาในการทดลอง
กระจาย(บางครั้งค่านี้เรียกว่าช่วง) ของกลุ่มตัวอย่างจะแสดงด้วยตัวอักษร R นี่เป็นตัวบ่งชี้ที่ง่ายที่สุดที่สามารถหาได้สำหรับตัวอย่าง - ความแตกต่างระหว่างค่าสูงสุดและต่ำสุดของชุดรูปแบบเฉพาะนี้
การกระจายตัวคือค่าเฉลี่ยเลขคณิตของการเบี่ยงเบนกำลังสองของค่าของตัวแปรจากค่าเฉลี่ย
2. วิธีการประมวลผลทางสถิติทุติยภูมิของผลการทดลอง
ด้วยความช่วยเหลือของวิธีรองในการประมวลผลข้อมูลการทดลองทางสถิติ สมมติฐานที่เกี่ยวข้องกับการทดลองจะได้รับการทดสอบ พิสูจน์ หรือหักล้างโดยตรง ตามกฎแล้ววิธีการเหล่านี้มีความซับซ้อนมากกว่าวิธีการประมวลผลทางสถิติเบื้องต้น และกำหนดให้ผู้วิจัยต้องได้รับการฝึกอบรมอย่างดีในด้านคณิตศาสตร์และสถิติเบื้องต้น
กลุ่มวิธีการภายใต้การสนทนาสามารถแบ่งออกเป็นกลุ่มย่อยได้หลายกลุ่ม:
1 แคลคูลัสการถดถอย
แคลคูลัสการถดถอยเป็นวิธีการหนึ่งของสถิติทางคณิตศาสตร์ที่ทำให้สามารถลดข้อมูลส่วนตัวที่กระจัดกระจายลงเหลือเพียงกราฟเชิงเส้นบางกราฟที่สะท้อนถึงความสัมพันธ์ภายในโดยประมาณ และสามารถประมาณค่าที่เป็นไปได้ของตัวแปรอื่นโดยอิงจากค่าของหนึ่งในนั้น ตัวแปร
2.สหสัมพันธ์
วิธีถัดไปของการประมวลผลทางสถิติรองซึ่งมีการกำหนดการเชื่อมต่อหรือการพึ่งพาโดยตรงระหว่างข้อมูลการทดลองสองชุดเรียกว่าวิธีความสัมพันธ์ มันแสดงให้เห็นว่าปรากฏการณ์หนึ่งมีอิทธิพลหรือเกี่ยวข้องกับปรากฏการณ์อื่นอย่างไรในพลวัตของมัน มีการพึ่งพาประเภทนี้อยู่ เช่น ระหว่างปริมาณที่อยู่ในความสัมพันธ์ระหว่างเหตุและผลซึ่งกันและกัน หากปรากฏว่าปรากฏการณ์ทั้งสองมีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติ และหากมีความมั่นใจว่าปรากฏการณ์หนึ่งสามารถเป็นสาเหตุของอีกปรากฏการณ์หนึ่งได้ สรุปได้ว่า มีความสัมพันธ์ระหว่างเหตุและผลอย่างแน่นอน ดังต่อไปนี้
3 การวิเคราะห์ปัจจัย
การวิเคราะห์ปัจจัยเป็นวิธีการทางสถิติที่ใช้ในการประมวลผลข้อมูลการทดลองจำนวนมาก วัตถุประสงค์ของการวิเคราะห์ปัจจัยคือ การลดจำนวนตัวแปร (การลดข้อมูล) และการกำหนดโครงสร้างความสัมพันธ์ระหว่างตัวแปร ได้แก่ การจำแนกตัวแปร ดังนั้น การวิเคราะห์ปัจจัยจึงใช้เป็นวิธีการลดข้อมูลหรือวิธีการจำแนกโครงสร้าง
ทบทวนคำถาม
1.วิธีการประมวลผลทางสถิติคืออะไร?
2.กลุ่มย่อยใดบ้างที่เป็นวิธีรองของการประมวลผลทางสถิติแบ่งออกเป็น?
3.อธิบายสาระสำคัญของวิธีสหสัมพันธ์ได้อย่างไร
4. ในกรณีใดบ้างที่ใช้วิธีการประมวลผลทางสถิติ?
5. คุณคิดว่าการใช้วิธีประมวลผลทางสถิติในการวิจัยทางวิทยาศาสตร์มีประสิทธิผลเพียงใด
2. พิจารณาคุณสมบัติของวิธีการประมวลผลข้อมูลทางสถิติ
วรรณกรรม
1.. กอร์บาตอฟ ดี.เอส. การประชุมเชิงปฏิบัติการเรื่องการวิจัยทางจิตวิทยา: Proc. เบี้ยเลี้ยง. - Samara: "BAKHRAH - M", 2546 - 272 หน้า
2. Ermolaev A.Yu. สถิติทางคณิตศาสตร์สำหรับนักจิตวิทยา - อ.: สถาบันจิตวิทยาและสังคมแห่งมอสโก: Flinta, 2003.336p
3. คอร์นิโลวา ทีวี การทดลองทางจิตวิทยาเบื้องต้น หนังสือเรียนสำหรับมหาวิทยาลัย อ.: สำนักพิมพ์ CheRo, 2544.