การประมวลผลข้อมูลเชิงสถิติ การประมวลผลข้อมูลทางสถิติ คำจำกัดความของการประมวลผลข้อมูลทางสถิติ

  • สไลด์ 2

    • สถิติเป็นวิทยาศาสตร์ที่แน่นอนที่ศึกษาวิธีการรวบรวม วิเคราะห์ และประมวลผลข้อมูลที่อธิบายการกระทำ ปรากฏการณ์ และกระบวนการของมวล
    • สถิติทางคณิตศาสตร์เป็นสาขาหนึ่งของคณิตศาสตร์ที่ศึกษาวิธีการรวบรวม การจัดระบบ และการประมวลผลผลลัพธ์ของการสังเกตปรากฏการณ์มวลแบบสุ่ม เพื่อระบุรูปแบบที่มีอยู่
  • สไลด์ 3

    การศึกษาสถิติ

    • จำนวนกลุ่มประชากรแต่ละกลุ่มของประเทศและภูมิภาค
    • การผลิตและการบริโภคผลิตภัณฑ์ประเภทต่างๆ
    • การขนส่งสินค้าและคนโดยสารด้วยการขนส่งรูปแบบต่างๆ
    • ทรัพยากรธรรมชาติ และอื่นๆ อีกมากมาย
    • ผลการศึกษาทางสถิติถูกนำมาใช้กันอย่างแพร่หลายในการสรุปเชิงปฏิบัติและเชิงวิทยาศาสตร์
    • ปัจจุบันเริ่มมีการศึกษาสถิติแล้วใน มัธยมในมหาวิทยาลัย นี่เป็นวิชาบังคับ เนื่องจากมีความเกี่ยวข้องกับวิทยาศาสตร์และสาขาวิชาต่างๆ มากมาย
    • เพื่อเพิ่มจำนวนการขายในร้านค้า เพื่อปรับปรุงคุณภาพความรู้ในโรงเรียน เพื่อขับเคลื่อนประเทศไปสู่การเติบโตทางเศรษฐกิจ จำเป็นต้องทำการศึกษาทางสถิติและหาข้อสรุปที่เหมาะสม และทุกคนควรจะสามารถทำเช่นนี้ได้
  • สไลด์ 4

    เป้าหมายหลักของการศึกษาองค์ประกอบของสถิติ

    • การก่อตัวของทักษะในการประมวลผลข้อมูลทางสถิติเบื้องต้น
    • ภาพและการวิเคราะห์ข้อมูลเชิงปริมาณที่นำเสนอในรูปแบบต่างๆ (ในรูปของตาราง แผนภาพ กราฟของการพึ่งพาจริง)
    • การพัฒนาแนวคิดเกี่ยวกับแนวคิดทางสถิติที่สำคัญ ได้แก่ แนวคิดเรื่องการประมาณค่าและแนวคิดในการทดสอบสมมติฐานทางสถิติ
    • พัฒนาความสามารถในการเปรียบเทียบความน่าจะเป็นของเหตุการณ์สุ่มที่เกิดขึ้นกับผลการทดลองเฉพาะ
  • สไลด์ 5

    • ชุดข้อมูล
    • ปริมาณชุดข้อมูล
    • ช่วงของชุดข้อมูล
    • โหมดชุดข้อมูล
    • ค่ามัธยฐานของซีรีส์
    • เฉลี่ย
    • สั่งซื้อชุดข้อมูล
    • ตารางการกระจายข้อมูล
    • มาสรุปกัน
    • ชุดข้อมูลการเสนอชื่อ
    • ความถี่ผลลัพธ์
    • ความถี่เปอร์เซ็นต์
    • การจัดกลุ่มข้อมูล
    • วิธีการประมวลผลข้อมูล
    • มาสรุปกัน
  • สไลด์ 6

    คำนิยาม

    • ชุดข้อมูลคือชุดผลลัพธ์ของการวัดบางอย่าง
    • ตัวอย่างเช่น:1) การวัดส่วนสูงของมนุษย์
    • 2) การวัดน้ำหนักมนุษย์ (สัตว์)
    • 3) ค่ามิเตอร์ (ไฟฟ้า, น้ำ, ความร้อน...)
    • 4) ผลการแข่งขันในระยะ 100 เมตร
    • ฯลฯ
  • สไลด์ 7

    • ปริมาณของชุดข้อมูลคือปริมาณของข้อมูลทั้งหมด
    • ตัวอย่างเช่น ให้ชุดตัวเลข 1; 3; 6; -4; 0
    • ปริมาตรของมันจะเท่ากับ 5 ทำไม?
  • สไลด์ 8

    ทำงานให้เสร็จ

    • กำหนดระดับเสียงของซีรี่ส์นี้
    • คำตอบ: 10
  • สไลด์ 9

    คำนิยาม

    • พิสัยคือความแตกต่างระหว่างตัวเลขที่ใหญ่ที่สุดและน้อยที่สุดในชุดข้อมูล
    • ตัวอย่างเช่น: หากได้รับชุดตัวเลข 1; 3; 6; -4; 0; 2 ดังนั้นช่วงของชุดข้อมูลนี้จะเท่ากับ 6 (เนื่องจาก 6 - 0 = 6)
  • สไลด์ 10

    ทำงานให้เสร็จ

    • ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่สอดคล้องกัน: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5
    • กำหนดช่วงของซีรี่ส์นี้
    • คำตอบ: 3
  • สไลด์ 11

    คำนิยาม

    • โหมดของชุดข้อมูลคือจำนวนชุดข้อมูลที่เกิดขึ้นบ่อยที่สุดในชุดข้อมูลนี้
    • ชุดข้อมูลอาจมีหรือไม่มีโหมด
    • ดังนั้น ในชุดข้อมูล 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 แต่ละหมายเลข 47 และ 52 เกิดขึ้นสองครั้ง และตัวเลขที่เหลือน้อยกว่าสองครั้ง ในกรณีเช่นนี้ มีการตกลงกันว่าซีรีส์นี้มีสองโหมด: 47 และ 52
  • สไลด์ 12

    ทำงานให้เสร็จ

    • ดังนั้นในชุดข้อมูล
    • 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 แต่ละหมายเลขของ 47 และ 52 ปรากฏขึ้นสองครั้ง และหมายเลขที่เหลือน้อยกว่าสองครั้ง ในกรณีเช่นนี้ มีการตกลงกันว่าซีรีส์นี้มีสองโหมด: 47 และ 52
    • ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่เหมาะสม:
    • 3, 5, 5, 4, 4, 4, 3, 2, 4, 5.
    • กำหนดโหมดของซีรีย์นี้
    • คำตอบ: 4
  • สไลด์ 13

    คำนิยาม

    • ค่ามัธยฐานที่มีพจน์เป็นเลขคี่คือตัวเลขที่เขียนไว้ตรงกลาง
    • ค่ามัธยฐานที่มีพจน์เป็นจำนวนคู่คือค่าเฉลี่ยเลขคณิตของตัวเลขสองตัวที่เขียนไว้ตรงกลาง
    • ตัวอย่างเช่น กำหนดค่ามัธยฐานของชุดตัวเลข
    • 16; -4; 5; -2; -3; 3; 3; -2; 3. คำตอบ: -3
    • 2) -1; 0; 2; 1; -1; 0;2; -1. คำตอบ: 0
  • สไลด์ 14

    ทำงานให้เสร็จ

    • ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่สอดคล้องกัน: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5
    • กำหนดค่ามัธยฐานของซีรี่ส์นี้
    • คำตอบ: 4
  • สไลด์ 15

    คำนิยาม

    • ค่าเฉลี่ยเลขคณิตคือผลหารของการหารผลรวมของตัวเลขในชุดข้อมูลด้วยตัวเลข
    • ตัวอย่างเช่น ให้ชุดตัวเลข -1; 0; 2; 1; -1; 0; 2; -1. จากนั้นค่าเฉลี่ยเลขคณิตจะเท่ากับ: (-1+0+2+1+(-1)+0+2+(-1)):8 =2:8=0.25
  • สไลด์ 16

    ทำงานให้เสร็จ

    • ที่สถาบันเราทำการทดสอบวิชาคณิตศาสตร์ขั้นสูง ในกลุ่มมี 10 คน และพวกเขาได้รับคะแนนที่สอดคล้องกัน: 3, 5, 5, 4, 4, 4, 3, 2, 4, 5
    • หาค่าเฉลี่ยเลขคณิตของอนุกรมนี้
    • คำตอบ: 3.9
  • สไลด์ 17

    การปฏิบัติงาน

    • การมอบหมาย: อธิบายลักษณะผลงานของนักเรียน Ivanov ในวิชาคณิตศาสตร์สำหรับไตรมาสที่สี่
    • เสร็จสิ้นการทำงาน:
    • 1.การรวบรวมข้อมูล:
    • เกรดที่เขียนจากนิตยสารคือ: 5,4,5,3,3,5,4,4,4
    • 2.การประมวลผลข้อมูลที่ได้รับ:
    • ปริมาณ = 9
    • ช่วง = 5 - 3 = 2
    • แฟชั่น = 4
    • ค่ามัธยฐาน = 3
    • ค่าเฉลี่ยเลขคณิต =(5+4+5+3+3+5+4+4+4) : 9 กลับไปยัง 4
    • ลักษณะของผลการเรียน: นักเรียนไม่พร้อมสำหรับบทเรียนเสมอไป
    • ส่วนใหญ่เขาเรียนด้วยเกรด "4" หนึ่งในสี่ออกมาเป็น "4"
  • สไลด์ 18

    ด้วยตัวเอง

    • เราจำเป็นต้องค้นหาปริมาตรของอนุกรม ช่วงของอนุกรม โหมด ค่ามัธยฐาน และค่าเฉลี่ยเลขคณิต:
    • การ์ด 1. 22.5; 23; 21.5; 22; 23.
    • การ์ด 2.6; -4; 5; -2; -3; 3; 3; -2; 3.
    • ใบที่ 3 12.5; 12; 12; 12.5; 13; 12.5; 13.
    • การ์ด 4. -1; 0; 2; 1; -1; 0; 2; -1.
    • การ์ด 5. 125; 130; 124; 131.
    • การ์ด 6. 120; 100; 110.
  • สไลด์ 19

    มาตรวจสอบกัน

    • การ์ด 1.
    • ปริมาณแถว = 5
    • ช่วงของแถว = 10
    • แฟชั่น = 23
    • มัธยฐาน = 21.5
    • ค่าเฉลี่ยเลขคณิต = 13.3
    • การ์ด 3.
    • ปริมาณแถว = 7
    • ช่วงของอนุกรม = 1
    • โหมด = 12.5
    • มัธยฐาน = 12.5
    • ค่าเฉลี่ยเลขคณิต = 12.5
    • การ์ด 2.
    • ปริมาณแถว = 9
    • ช่วงของแถว = 10
    • แฟชั่น = 3
    • ค่ามัธยฐาน = -3
    • ค่าเฉลี่ยเลขคณิต = 1
    • การ์ด 4.
    • ปริมาณแถว = 8
    • ช่วงของแถว = 3
    • โหมด = -1
    • ค่ามัธยฐาน = 0
    • ค่าเฉลี่ยเลขคณิต = 0.25
  • สไลด์ 20

    • การ์ด 5.
    • ปริมาณแถว = 4
    • ช่วงแถว = 7
    • แฟชั่น = ไม่
    • มัธยฐาน = 127
    • ค่าเฉลี่ยเลขคณิต = 127.5
    • การ์ด 6.
    • ปริมาณแถว = 3
    • ช่วงช่วง = 20
    • แฟชั่น = ไม่
    • มัธยฐาน = 100
    • ค่าเฉลี่ยเลขคณิต = 110
  • สไลด์ 21

    คำนิยาม

    • ชุดข้อมูลที่เรียงลำดับคือชุดข้อมูลที่มีการจัดเรียงตามกฎบางอย่าง
    • จะจัดเรียงชุดตัวเลขได้อย่างไร? (เขียนตัวเลขให้แต่ละตัวเลขต่อมาไม่น้อย (ไม่มาก) กว่าตัวเลขก่อนหน้า) หรือเขียนชื่อบางชื่อ "ตามลำดับตัวอักษร"...
  • สไลด์ 22

    ทำงานให้เสร็จ

    • รับชุดตัวเลข:
    • -1;-3;-3;-2;3;3;2;0;3;3;-3;-3;1;1;-3;-1
    • เรียงตามลำดับเลขจากน้อยไปมาก
    • สารละลาย:
    • -3;-3;-3;-3;-3;-2;-1;-1;0;1;1;2;3;3;3;3
    • ผลลัพธ์ที่ได้คือซีรีย์ที่สั่ง ข้อมูลเองไม่ได้เปลี่ยนแปลง มีเพียงลำดับที่ปรากฏเท่านั้นที่เปลี่ยนแปลง
  • สไลด์ 23

    คำนิยาม

    • ตารางการกระจายข้อมูลคือตารางของอนุกรมที่เรียงลำดับซึ่งแทนที่จะทำซ้ำตัวเลขเดียวกัน ระบบจะบันทึกจำนวนการซ้ำ
    • ในทางกลับกัน หากทราบตารางการแจกจ่าย ก็จะสามารถรวบรวมข้อมูลตามลำดับได้
    • ตัวอย่างเช่น:
    • จากนั้นเราจะได้ซีรีย์ที่สั่งดังต่อไปนี้:
    • -3;-3;-3;-1;-1;-1;-1;5;5;7;8;8;8;8;8
  • สไลด์ 24

    ทำงานให้เสร็จ

    • ในร้านขายรองเท้าสตรีแห่งหนึ่ง มีการวิจัยทางสถิติและรวบรวมตารางที่เกี่ยวข้องสำหรับราคารองเท้าและจำนวนยอดขาย:
    • ราคา (ถู): 500 1200 1500 1800 2000 2500
    • จำนวน: 8 9 14 15 3 1
    • สำหรับตัวบ่งชี้เหล่านี้ คุณจะต้องค้นหาคุณลักษณะทางสถิติ:
    • สร้างชุดข้อมูลตามลำดับ
    • ปริมาณของชุดข้อมูล
    • ช่วงซีรีส์
    • ชุดแฟชั่น
    • ค่ามัธยฐานของซีรีส์
    • ค่าเฉลี่ยเลขคณิตของชุดข้อมูล
  • สไลด์ 25

    และตอบคำถามต่อไปนี้

    • จากหมวดราคาเหล่านี้ ร้านค้าไม่ควรขายรองเท้าที่ราคาใด
    • รองเท้าควรแบ่งราคาเท่าไหร่?
    • คุณควรตั้งเป้าหมายราคาเท่าไร?
  • สไลด์ 26

    มาสรุปกัน

    • เราคุ้นเคยกับแนวคิดเบื้องต้นว่าการประมวลผลข้อมูลทางสถิติเกิดขึ้นได้อย่างไร:
    • ข้อมูลมักเป็นผลมาจากการวัดบางอย่างเสมอ
    • ข้อมูลบางส่วนสามารถพบได้:
    • ระดับเสียง ช่วง โหมด ค่ามัธยฐาน และ
    • เฉลี่ย
    • 3) ชุดข้อมูลใดก็ได้
    • จัดระเบียบและเขียน
    • ตารางการกระจายข้อมูล
  • สไลด์ 27

    คำนิยาม

    • ชุดข้อมูลที่ระบุชื่อไม่ใช่ข้อมูลเชิงตัวเลข แต่เช่น ชื่อ ชื่อ; การเสนอชื่อ...
    • ตัวอย่างเช่น: รายชื่อผู้เข้ารอบสุดท้ายของฟุตบอลโลกตั้งแต่ปี 1930: อาร์เจนตินา, เชโกสโลวาเกีย, ฮังการี, บราซิล, ฮังการี, สวีเดน, เชโกสโลวะเกีย, เยอรมนี, อิตาลี, เนเธอร์แลนด์, เนเธอร์แลนด์, เยอรมนี, เยอรมนี,
    • อาร์เจนตินา อิตาลี บราซิล เยอรมนี ฝรั่งเศส
  • สไลด์ 28

    ทำงานให้เสร็จ

    • ค้นหาจากตัวอย่างก่อนหน้า:
    • ปริมาณของแถวที่ 2) โหมดของแถว
    • 3) สร้างตารางการแจกจ่าย
    • วิธีแก้ไข: ปริมาตร = 18; แฟชั่น – ทีมเยอรมัน.
  • งานห้องปฏิบัติการหมายเลข 3 การประมวลผลข้อมูลทางสถิติในระบบ MatLab

    คำแถลงทั่วไปของปัญหา

    วัตถุประสงค์หลักของการดำเนินการ งานห้องปฏิบัติการคือการทำความคุ้นเคยกับพื้นฐานของการทำงานกับการประมวลผลข้อมูลทางสถิติในสภาพแวดล้อม MatLAB

    ส่วนทางทฤษฎี

    การประมวลผลข้อมูลทางสถิติเบื้องต้น

    การประมวลผลข้อมูลทางสถิติขึ้นอยู่กับวิธีเชิงปริมาณหลักและรอง วัตถุประสงค์ของการประมวลผลข้อมูลทางสถิติเบื้องต้นคือเพื่อจัดโครงสร้างข้อมูลที่ได้รับ ซึ่งเกี่ยวข้องกับการจัดกลุ่มข้อมูลลงในตารางสรุปตามพารามิเตอร์ต่างๆ ข้อมูลปฐมภูมิจะต้องนำเสนอในรูปแบบที่ช่วยให้บุคคลสามารถประเมินชุดข้อมูลที่ได้โดยประมาณ และเพื่อระบุข้อมูลเกี่ยวกับการกระจายข้อมูลของตัวอย่างข้อมูลที่เป็นผล เช่น ความสม่ำเสมอหรือความกะทัดรัดของข้อมูล หลังจากการวิเคราะห์ข้อมูลหลักแล้ว จะใช้วิธีการประมวลผลข้อมูลทางสถิติรอง โดยพิจารณาจากรูปแบบทางสถิติในชุดข้อมูลที่มีอยู่

    การดำเนินการวิเคราะห์ทางสถิติเบื้องต้นในอาร์เรย์ข้อมูลช่วยให้คุณได้รับความรู้เกี่ยวกับสิ่งต่อไปนี้:

    ค่าใดที่เป็นค่าปกติมากที่สุดสำหรับตัวอย่าง เพื่อตอบคำถามนี้ จึงมีการกำหนดการวัดแนวโน้มจากส่วนกลาง

    การแพร่กระจายของข้อมูลมีขนาดใหญ่เพียงใดเมื่อเทียบกับค่าคุณลักษณะนี้ เช่น "ความคลุมเครือ" ของข้อมูลคืออะไร ใน ในกรณีนี้มีการกำหนดมาตรการวัดความแปรปรวน

    เป็นที่น่าสังเกตว่าตัวบ่งชี้ทางสถิติของแนวโน้มและความแปรปรวนส่วนกลางนั้นพิจารณาจากข้อมูลเชิงปริมาณเท่านั้น

    มาตรการแนวโน้มส่วนกลาง– กลุ่มของค่าที่ข้อมูลส่วนที่เหลือถูกจัดกลุ่ม ดังนั้น การวัดแนวโน้มส่วนกลางจะสรุปอาร์เรย์ของข้อมูลซึ่งทำให้สามารถสร้างข้อสรุปทั้งเกี่ยวกับตัวอย่างโดยรวมและดำเนินการ การวิเคราะห์เปรียบเทียบตัวอย่างที่แตกต่างกันซึ่งกันและกัน

    สมมติว่าเรามีตัวอย่างข้อมูล การวัดแนวโน้มส่วนกลางจะได้รับการประเมินโดยตัวบ่งชี้ต่อไปนี้:

    1. ค่าเฉลี่ยตัวอย่างคือผลลัพธ์ของการหารผลรวมของค่าตัวอย่างทั้งหมดด้วยจำนวนที่กำหนดโดยสูตร (3.1)

    (3.1)

    ที่ไหน - ฉันองค์ประกอบที่ 3 ของการเลือก

    n– จำนวนองค์ประกอบตัวอย่าง

    ค่าเฉลี่ยตัวอย่างให้ความแม่นยำสูงสุดในกระบวนการประมาณค่าแนวโน้มจากศูนย์กลาง

    สมมติว่าเรามีกลุ่มตัวอย่างจำนวน 20 คน. องค์ประกอบตัวอย่างเป็นข้อมูลเกี่ยวกับรายได้เฉลี่ยต่อเดือนของแต่ละคน สมมติว่า 19 คนมีรายได้เฉลี่ยต่อเดือน 20,000 รูเบิล และ 1 คนที่มีรายได้ 300 ตัน รายได้รวมต่อเดือนของกลุ่มตัวอย่างทั้งหมดคือ 680 รูเบิล ค่าเฉลี่ยตัวอย่างในกรณีนี้คือ S=34


    2. ค่ามัธยฐาน– สร้างค่าด้านบนและด้านล่างซึ่งจำนวนค่าที่แตกต่างกันจะเท่ากัน กล่าวคือ นี่คือค่ากลางในชุดข้อมูลตามลำดับ กำหนดโดยขึ้นอยู่กับจำนวนองค์ประกอบที่เป็นคู่/คี่ในตัวอย่างโดยใช้สูตร (3.2) หรือ (3.3) อัลกอริทึมสำหรับการประมาณค่ามัธยฐานสำหรับตัวอย่างข้อมูล:

    ประการแรก ข้อมูลจะถูกจัดอันดับ (เรียงลำดับ) จากมากไปน้อย/จากน้อยไปหามาก

    หากตัวอย่างที่สั่งมีจำนวนองค์ประกอบเป็นเลขคี่ ค่ามัธยฐานจะตรงกับค่ากลาง

    (3.2)

    ที่ไหน n

    ในกรณีขององค์ประกอบจำนวนคู่ ค่ามัธยฐานจะถูกกำหนดให้เป็นค่าเฉลี่ยเลขคณิตของค่ากลางทั้งสองค่า

    (3.3)

    องค์ประกอบเฉลี่ยของตัวอย่างที่สั่งอยู่ที่ไหน

    - องค์ประกอบของการเลือกคำสั่งถัดจาก ;

    จำนวนองค์ประกอบตัวอย่าง

    หากองค์ประกอบตัวอย่างทั้งหมดแตกต่างกัน องค์ประกอบตัวอย่างครึ่งหนึ่งจะมีค่ามากกว่าค่ามัธยฐาน และอีกครึ่งหนึ่งจะน้อยกว่า ตัวอย่างเช่น สำหรับกลุ่มตัวอย่าง (1, 5, 9, 15, 16) ค่ามัธยฐานจะเท่ากับองค์ประกอบ 9

    ในการวิเคราะห์ข้อมูลทางสถิติ ค่ามัธยฐานจะช่วยระบุองค์ประกอบตัวอย่างที่มีอิทธิพลอย่างมากต่อค่าของค่าเฉลี่ยตัวอย่าง

    สมมติว่าเรามีกลุ่มตัวอย่างจำนวน 20 คน. องค์ประกอบตัวอย่างเป็นข้อมูลเกี่ยวกับรายได้เฉลี่ยต่อเดือนของแต่ละคน สมมติว่า 19 คนมีรายได้เฉลี่ยต่อเดือน 20,000 รูเบิล และ 1 คนที่มีรายได้ 300 ตัน รายได้รวมต่อเดือนของกลุ่มตัวอย่างทั้งหมดคือ 680 รูเบิล ค่ามัธยฐานหลังจากสั่งตัวอย่าง จะถูกกำหนดให้เป็นค่าเฉลี่ยเลขคณิตขององค์ประกอบที่สิบและสิบเอ็ดของกลุ่มตัวอย่าง) และเท่ากับ Me = 20 tr ผลลัพธ์นี้ตีความดังนี้: ค่ามัธยฐานแบ่งกลุ่มตัวอย่างออกเป็นสองกลุ่มเพื่อสรุปได้ว่าในกลุ่มแรกแต่ละคนมีรายได้เฉลี่ยต่อเดือนไม่เกิน 20,000 รูเบิลและในกลุ่มที่สองไม่น้อยกว่า 20,000 รูเบิล . ใน ในตัวอย่างนี้เราสามารถพูดได้ว่าค่ามัธยฐานนั้นมีลักษณะเฉพาะที่บุคคล "โดยเฉลี่ย" มีรายได้เท่าใด แม้ว่าค่าของค่าเฉลี่ยตัวอย่างจะเกินอย่างมีนัยสำคัญ S=34 ซึ่งบ่งชี้ถึงการยอมรับไม่ได้ของคุณลักษณะนี้เมื่อประเมินรายได้เฉลี่ย

    ดังนั้น ยิ่งความแตกต่างระหว่างค่ามัธยฐานและค่าเฉลี่ยตัวอย่างมากเท่าใด การกระจายตัวของข้อมูลตัวอย่างก็จะยิ่งมากขึ้นเท่านั้น (ในตัวอย่างที่พิจารณา บุคคลที่มีรายได้ 300 รูเบิลจะแตกต่างจากคนทั่วไปในกลุ่มตัวอย่างเฉพาะอย่างชัดเจนและมีนัยสำคัญ กระทบต่อประมาณการรายได้เฉลี่ย) จะทำอย่างไรกับองค์ประกอบดังกล่าวจะถูกตัดสินใจในแต่ละกรณี แต่ในกรณีทั่วไป เพื่อให้มั่นใจในความน่าเชื่อถือของกลุ่มตัวอย่าง พวกเขาจะถูกลบออก เนื่องจากมีอิทธิพลอย่างมากต่อการประเมินตัวบ่งชี้ทางสถิติ

    3. แฟชั่น (โม)– สร้างค่าที่เกิดขึ้นบ่อยที่สุดในตัวอย่าง เช่น ค่าที่มีความถี่สูงสุด อัลกอริธึมการประมาณค่าโหมด:

    ในกรณีที่ตัวอย่างมีองค์ประกอบที่เกิดขึ้นบ่อยครั้งเท่ากัน กล่าวกันว่าไม่มีโหมดในตัวอย่างนี้

    ถ้าสอง องค์ประกอบใกล้เคียงตัวอย่างมีความถี่เท่ากัน ซึ่งมากกว่าความถี่ขององค์ประกอบที่เหลือของตัวอย่าง จากนั้นโหมดจะถูกกำหนดให้เป็นค่าเฉลี่ยของทั้งสองค่านี้

    หากองค์ประกอบตัวอย่างสองรายการมีความถี่เท่ากัน ซึ่งมากกว่าความถี่ขององค์ประกอบตัวอย่างที่เหลือ และองค์ประกอบเหล่านี้ไม่ได้อยู่ติดกัน ตัวอย่างจะมีสองโหมด

    โหมดในการวิเคราะห์ทางสถิติใช้ในสถานการณ์ที่จำเป็นต้องมีการประเมินการวัดแนวโน้มจากส่วนกลางอย่างรวดเร็ว และไม่จำเป็นต้องมีความแม่นยำสูง ตัวอย่างเช่น แฟชั่น (ตามขนาดหรือแบรนด์) สามารถใช้เพื่อระบุเสื้อผ้าและรองเท้าที่เป็นที่ต้องการของลูกค้ามากที่สุดได้อย่างสะดวก

    การวัดการกระจาย (ความแปรปรวน)– กลุ่มตัวบ่งชี้ทางสถิติที่แสดงลักษณะความแตกต่างระหว่างค่าตัวอย่างแต่ละค่า จากตัวบ่งชี้การวัดการกระจายตัว สามารถประเมินระดับความเป็นเนื้อเดียวกันและความแน่นขององค์ประกอบตัวอย่างได้ การวัดการกระจายตัวมีลักษณะเฉพาะโดยชุดตัวบ่งชี้ต่อไปนี้:

    1. พิสัย -นี่คือช่วงเวลาระหว่างค่าสูงสุดและต่ำสุดของผลการสังเกต (องค์ประกอบตัวอย่าง) ตัวบ่งชี้ช่วงบ่งชี้การกระจายของค่าในชุดข้อมูล หากช่วงมีขนาดใหญ่ ค่าในผลรวมจะกระจัดกระจายมาก มิฉะนั้น (ช่วงจะน้อย) ว่ากันว่าค่าในผลรวมนั้นอยู่ใกล้กัน ช่วงถูกกำหนดโดยสูตร (3.4)

    (3.4)

    ที่ไหน - องค์ประกอบตัวอย่างสูงสุด

    - องค์ประกอบตัวอย่างขั้นต่ำ

    2.ส่วนเบี่ยงเบนเฉลี่ย– ผลต่างของค่าเฉลี่ยเลขคณิต (ในค่าสัมบูรณ์) ระหว่างแต่ละค่าในกลุ่มตัวอย่างกับค่าเฉลี่ยของกลุ่มตัวอย่าง ค่าเบี่ยงเบนเฉลี่ยถูกกำหนดโดยสูตร (3.5)

    (3.5)

    ที่ไหน - ฉันองค์ประกอบที่ 3 ของการเลือก

    ค่าเฉลี่ยตัวอย่างคำนวณโดยใช้สูตร (3.1)

    จำนวนองค์ประกอบตัวอย่าง

    โมดูล จำเป็นเนื่องจากการเบี่ยงเบนจากค่าเฉลี่ยสำหรับแต่ละองค์ประกอบเฉพาะสามารถเป็นได้ทั้งบวกและลบ ดังนั้น หากคุณไม่เลือกโมดูล ผลรวมของการเบี่ยงเบนทั้งหมดจะเข้าใกล้ศูนย์ และจะเป็นไปไม่ได้ที่จะตัดสินระดับของความแปรปรวนของข้อมูล (การอัดแน่นของข้อมูลรอบๆ ค่าเฉลี่ยตัวอย่าง) เมื่อทำการวิเคราะห์ทางสถิติ อาจใช้โหมดและค่ามัธยฐานแทนค่าเฉลี่ยตัวอย่าง

    3. การกระจายตัว- การวัดการกระจายตัวที่อธิบายค่าเบี่ยงเบนเปรียบเทียบระหว่างค่าข้อมูลและค่าเฉลี่ย คำนวณเป็นผลรวมของค่าเบี่ยงเบนกำลังสองของแต่ละองค์ประกอบตัวอย่างจากค่าเฉลี่ย ความแปรปรวนจะถูกประมาณไว้ ขึ้นอยู่กับขนาดของกลุ่มตัวอย่าง วิธีทางที่แตกต่าง:

    สำหรับตัวอย่างขนาดใหญ่ (n>30) ตามสูตร (3.6)

    (3.6)

    สำหรับตัวอย่างขนาดเล็ก (n<30) по формуле (3.7)

    (3.7)

    โดยที่ X i คือองค์ประกอบตัวอย่างที่ i

    S – ค่าเฉลี่ยตัวอย่าง;

    จำนวนองค์ประกอบตัวอย่าง

    (X i – S) - ส่วนเบี่ยงเบนจากค่าเฉลี่ยสำหรับแต่ละค่าของชุดข้อมูล

    4. ส่วนเบี่ยงเบนมาตรฐาน-การวัดว่าจุดข้อมูลที่กระจัดกระจายในวงกว้างสัมพันธ์กับค่าเฉลี่ยของจุดเหล่านั้นอย่างไร

    กระบวนการยกกำลังสองส่วนเบี่ยงเบนส่วนบุคคลเมื่อคำนวณความแปรปรวนจะเพิ่มระดับความเบี่ยงเบนของการเบี่ยงเบนที่เกิดขึ้นจากการเบี่ยงเบนเดิม ซึ่งจะทำให้เกิดข้อผิดพลาดเพิ่มเติม ดังนั้น เพื่อให้การประมาณค่าการแพร่กระจายของจุดข้อมูลสัมพันธ์กับค่าเฉลี่ยใกล้กับค่าเบี่ยงเบนเฉลี่ย จึงต้องใช้รากที่สองของความแปรปรวน รากที่แยกออกมาของความแปรปรวนจะแสดงลักษณะเฉพาะของการวัดความแปรปรวนที่เรียกว่าค่าเฉลี่ยรากกำลังสองหรือส่วนเบี่ยงเบนมาตรฐาน (3.8)

    (3.8)

    สมมติว่าคุณเป็นผู้จัดการโครงการพัฒนาซอฟต์แวร์ คุณมีโปรแกรมเมอร์ห้าคนภายใต้คำสั่งของคุณ ด้วยการจัดการกระบวนการดำเนินโครงการ คุณจะกระจายงานระหว่างโปรแกรมเมอร์ เพื่อให้ตัวอย่างง่ายขึ้น เราจะดำเนินการต่อจากข้อเท็จจริงที่ว่างานมีความซับซ้อนและเวลาในการดำเนินการเท่ากัน คุณตัดสินใจวิเคราะห์งานของโปรแกรมเมอร์แต่ละคน (จำนวนงานที่เสร็จสมบูรณ์ในระหว่างสัปดาห์) ในช่วง 10 สัปดาห์ที่ผ่านมา ซึ่งส่งผลให้คุณได้รับตัวอย่างต่อไปนี้:

    ชื่อสัปดาห์

    โดยการประมาณจำนวนเฉลี่ยของงานที่เสร็จสมบูรณ์ คุณจะได้ผลลัพธ์ต่อไปนี้:

    ชื่อสัปดาห์
    22,3
    22,4
    22,2
    22,1
    22,5

    ตามตัวบ่งชี้ S โปรแกรมเมอร์ทุกคนทำงานโดยเฉลี่ยโดยมีประสิทธิภาพเท่ากัน (ประมาณ 22 งานต่อสัปดาห์) อย่างไรก็ตาม ตัวบ่งชี้ความแปรปรวน (ช่วง) นั้นสูงมาก (จาก 5 งานสำหรับโปรแกรมเมอร์ตัวที่สี่ถึง 24 งานสำหรับตัวที่ห้า)

    ชื่อสัปดาห์
    22,3
    22,4
    22,2
    22,1
    22,5

    ลองประมาณค่าเบี่ยงเบนมาตรฐานซึ่งแสดงให้เห็นว่าค่าในกลุ่มตัวอย่างมีการกระจายอย่างไรสัมพันธ์กับค่าเฉลี่ย และโดยเฉพาะอย่างยิ่งในกรณีของเรา ให้ประมาณว่าการแพร่กระจายในการทำงานให้เสร็จสิ้นในแต่ละสัปดาห์มีขนาดใหญ่เพียงใด

    ชื่อสัปดาห์ ดังนั้น
    22,3 1,56
    22,4 1,8
    22,2 2,84
    22,1 1,3
    22,5 5,3

    ผลการประมาณค่าส่วนเบี่ยงเบนมาตรฐานจะระบุสิ่งต่อไปนี้ (เราจะประเมินกรณีสุดโต่งสองกรณี โปรแกรมเมอร์ 4 และ 5):

    แต่ละค่าในตัวอย่างโปรแกรมเมอร์ 4 คนเบี่ยงเบนโดยเฉลี่ย 1.3 ค่าจากค่าเฉลี่ย

    แต่ละค่าในตัวอย่างโปรแกรมเมอร์ 5 เบี่ยงเบนโดยเฉลี่ย 5.3 รายการจากค่าเฉลี่ย

    ยิ่งค่าเบี่ยงเบนมาตรฐานเข้าใกล้ 0 มากเท่าใด ค่าเฉลี่ยก็น่าเชื่อถือมากขึ้นเท่านั้น เนื่องจากค่าแต่ละค่าในกลุ่มตัวอย่างเกือบจะเท่ากับค่าเฉลี่ย (ในตัวอย่างของเราคือ 22.5 รายการ) ดังนั้นโปรแกรมเมอร์ 4 จึงมีความสอดคล้องมากที่สุด ไม่เหมือนโปรแกรมเมอร์ 5 ความแปรปรวนของการทำงานให้เสร็จสิ้นในแต่ละสัปดาห์สำหรับโปรแกรมเมอร์คนที่ 5 คือ 5.3 งาน ซึ่งบ่งบอกถึงการแพร่กระจายที่สำคัญ ในกรณีของโปรแกรมเมอร์คนที่ 5 ไม่สามารถเชื่อถือค่าเฉลี่ยได้ ดังนั้นจึงเป็นเรื่องยากที่จะคาดการณ์จำนวนงานที่เสร็จสมบูรณ์ในสัปดาห์หน้า ซึ่งจะทำให้ขั้นตอนการวางแผนและการยึดตามตารางงานมีความซับซ้อนยิ่งขึ้น ไม่สำคัญว่าคุณจะตัดสินใจด้านการจัดการอะไรในหลักสูตรนี้ สิ่งสำคัญคือคุณต้องได้รับการประเมินตามที่คุณสามารถตัดสินใจด้านการจัดการได้อย่างเหมาะสม

    ดังนั้นจึงสามารถสรุปโดยทั่วไปได้ว่าค่าเฉลี่ยไม่ได้ประเมินข้อมูลอย่างถูกต้องเสมอไป ความถูกต้องของการประมาณค่าเฉลี่ยสามารถตัดสินได้จากค่าส่วนเบี่ยงเบนมาตรฐาน

    วิธีการประมวลผลทางสถิติของผลการทดลองคือเทคนิคทางคณิตศาสตร์สูตรวิธีการคำนวณเชิงปริมาณด้วยความช่วยเหลือซึ่งตัวบ่งชี้ที่ได้รับระหว่างการทดลองสามารถสรุปได้ทั่วไปนำเข้าสู่ระบบโดยเปิดเผยรูปแบบที่ซ่อนอยู่ในตัวพวกเขา

    เรากำลังพูดถึงรูปแบบของลักษณะทางสถิติที่มีอยู่ระหว่างตัวแปรที่ศึกษาในการทดลอง

    ข้อมูล เป็นองค์ประกอบพื้นฐานที่จะจำแนกหรือจัดหมวดหมู่เพื่อวัตถุประสงค์ในการประมวลผล 26

    วิธีการวิเคราะห์ทางคณิตศาสตร์ - สถิติบางวิธีทำให้สามารถคำนวณสิ่งที่เรียกว่าสถิติทางคณิตศาสตร์เบื้องต้นซึ่งระบุลักษณะการกระจายตัวอย่างข้อมูลได้เช่น:

    ค่าเฉลี่ยตัวอย่าง

    ความแปรปรวนตัวอย่าง

    ค่ามัธยฐานและอื่น ๆ อีกจำนวนหนึ่ง

    วิธีอื่นๆ ของสถิติทางคณิตศาสตร์ทำให้สามารถตัดสินพลวัตของการเปลี่ยนแปลงในสถิติตัวอย่างแต่ละรายการได้ เช่น

    การวิเคราะห์ความแปรปรวน

    การวิเคราะห์การถดถอย

    เมื่อใช้วิธีการสุ่มตัวอย่างข้อมูลกลุ่มที่สาม เราสามารถตัดสินความสัมพันธ์ทางสถิติที่มีอยู่ระหว่างตัวแปรที่ศึกษาในการทดลองนี้ได้อย่างน่าเชื่อถือ:

    การวิเคราะห์สหสัมพันธ์

    การวิเคราะห์ปัจจัย

    วิธีการเปรียบเทียบ

    วิธีการวิเคราะห์ทางคณิตศาสตร์และสถิติทั้งหมดแบ่งตามอัตภาพออกเป็นประถมศึกษาและมัธยมศึกษา 27

    วิธีการหลักคือวิธีการที่ใช้เพื่อให้ได้ตัวบ่งชี้ที่สะท้อนผลการวัดที่ทำในการทดลองโดยตรง

    วิธีรองเรียกว่าวิธีการประมวลผลทางสถิติด้วยความช่วยเหลือซึ่งรูปแบบทางสถิติที่ซ่อนอยู่ในนั้นจะถูกเปิดเผยบนพื้นฐานของข้อมูลหลัก

    วิธีการหลักในการประมวลผลทางสถิติได้แก่:

    การหาค่าเฉลี่ยตัวอย่าง

    ความแปรปรวนตัวอย่าง

    แฟชั่นที่คัดสรร;

    ค่ามัธยฐานตัวอย่าง

    วิธีการรองมักประกอบด้วย:

    การวิเคราะห์สหสัมพันธ์

    การวิเคราะห์การถดถอย

    วิธีเปรียบเทียบสถิติปฐมภูมิในกลุ่มตัวอย่างตั้งแต่ 2 ตัวอย่างขึ้นไป

    พิจารณาวิธีคำนวณสถิติทางคณิตศาสตร์เบื้องต้นโดยเริ่มจากค่าเฉลี่ยตัวอย่าง

    ค่าเฉลี่ยเลขคณิต – เป็นอัตราส่วนของผลรวมของค่าข้อมูลทั้งหมดต่อจำนวนเทอม 28

    ค่าเฉลี่ยที่เป็นตัวบ่งชี้ทางสถิติแสดงถึงการประเมินคุณภาพทางจิตวิทยาโดยเฉลี่ยที่ศึกษาในการทดลอง

    การประเมินนี้แสดงถึงระดับของการพัฒนาโดยรวมในกลุ่มวิชาที่ได้รับการตรวจทางจิตเวช ด้วยการเปรียบเทียบค่าเฉลี่ยของกลุ่มตัวอย่างตั้งแต่สองตัวอย่างขึ้นไปโดยตรง เราสามารถตัดสินระดับการพัฒนาสัมพัทธ์ของคุณภาพที่ประเมินในกลุ่มคนที่สร้างกลุ่มตัวอย่างเหล่านี้ได้

    ค่าเฉลี่ยตัวอย่างถูกกำหนดโดยใช้สูตร 29 ต่อไปนี้:

    โดยที่ x cf คือค่าเฉลี่ยตัวอย่างหรือค่าเฉลี่ยเลขคณิตของกลุ่มตัวอย่าง

    n คือจำนวนวิชาในกลุ่มตัวอย่างหรือตัวบ่งชี้การวินิจฉัยทางจิตเวชส่วนตัวโดยพิจารณาจากค่าเฉลี่ยที่คำนวณ

    x k - ค่าส่วนตัวของตัวบ่งชี้สำหรับแต่ละวิชา มีตัวบ่งชี้ทั้งหมด n ตัวดังนั้นดัชนี k ของตัวแปรนี้จึงรับค่าตั้งแต่ 1 ถึง n

    ∑ เป็นเครื่องหมายที่ยอมรับในวิชาคณิตศาสตร์ในการรวมค่าของตัวแปรที่อยู่ทางด้านขวาของเครื่องหมายนี้

    การกระจายตัว คือการวัดการแพร่กระจายของข้อมูลสัมพันธ์กับค่าเฉลี่ย 30

    ยิ่งความแปรปรวนมากเท่าใด ความเบี่ยงเบนหรือการแพร่กระจายของข้อมูลก็จะยิ่งมากขึ้นเท่านั้น มีการกำหนดเพื่อให้สามารถแยกความแตกต่างจากค่าอื่น ๆ ที่มีค่าเฉลี่ยเท่ากัน แต่มีการกระจายต่างกัน

    ความแปรปรวนถูกกำหนดโดยสูตรต่อไปนี้:

    ความแปรปรวนตัวอย่างอยู่ที่ไหน หรือเพียงแค่ความแปรปรวน

    นิพจน์หมายความว่าสำหรับ xk ทั้งหมดตั้งแต่ตัวแรกจนถึงตัวสุดท้ายในตัวอย่างที่กำหนดให้ จำเป็นต้องคำนวณความแตกต่างระหว่างค่าบางส่วนและค่าเฉลี่ย จัดกำลังสองความแตกต่างเหล่านี้แล้วรวมเข้าด้วยกัน

    n คือจำนวนวิชาในกลุ่มตัวอย่างหรือค่าหลักที่ใช้คำนวณความแปรปรวน

    ค่ามัธยฐาน คือค่าของคุณลักษณะที่กำลังศึกษาโดยแบ่งกลุ่มตัวอย่างโดยเรียงลำดับตามค่าของคุณลักษณะนี้ครึ่งหนึ่ง

    การรู้ค่ามัธยฐานมีประโยชน์ในการพิจารณาว่าการกระจายตัวของค่าบางส่วนของคุณลักษณะที่ศึกษานั้นมีความสมมาตรและใกล้เคียงกับการแจกแจงแบบปกติหรือไม่ ค่าเฉลี่ยและค่ามัธยฐานของการแจกแจงแบบปกติมักจะเท่ากันหรือต่างกันน้อยมาก

    หากการกระจายตัวอย่างคุณลักษณะเป็นเรื่องปกติ ก็สามารถใช้วิธีการคำนวณทางสถิติรองตามการกระจายข้อมูลแบบปกติได้ มิฉะนั้นจะไม่สามารถทำได้เนื่องจากข้อผิดพลาดร้ายแรงอาจคืบคลานเข้าสู่การคำนวณ

    แฟชั่น สถิติทางคณิตศาสตร์เบื้องต้นอีกประการหนึ่งและลักษณะของการกระจายข้อมูลการทดลอง Mode คือค่าเชิงปริมาณของคุณลักษณะที่กำลังศึกษา ซึ่งมักพบในตัวอย่าง

    สำหรับการกระจายคุณสมบัติแบบสมมาตรรวมถึงการแจกแจงแบบปกติ ค่าโหมดจะตรงกับค่ากลางและค่ามัธยฐาน สำหรับการแจกแจงประเภทอื่นๆ ที่ไม่สมมาตร นี่ไม่ใช่เรื่องปกติ

    วิธีการประมวลผลทางสถิติทุติยภูมิซึ่งกำหนดการเชื่อมต่อหรือการพึ่งพาโดยตรงระหว่างข้อมูลการทดลองสองชุดเรียกว่า วิธีการวิเคราะห์สหสัมพันธ์ มันแสดงให้เห็นว่าปรากฏการณ์หนึ่งมีอิทธิพลหรือเกี่ยวข้องกับปรากฏการณ์อื่นอย่างไรในพลวัตของมัน มีการพึ่งพาประเภทนี้อยู่ เช่น ระหว่างปริมาณที่อยู่ในความสัมพันธ์ระหว่างเหตุและผลซึ่งกันและกัน หากปรากฏว่าปรากฏการณ์ทั้งสองมีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติ และหากมีความมั่นใจว่าปรากฏการณ์หนึ่งสามารถเป็นสาเหตุของอีกปรากฏการณ์หนึ่งได้ สรุปได้ว่า มีความสัมพันธ์ระหว่างเหตุและผลอย่างแน่นอน ดังต่อไปนี้

    วิธีการนี้มีหลายประเภท:

    การวิเคราะห์ความสัมพันธ์เชิงเส้นทำให้คุณสามารถสร้างการเชื่อมต่อโดยตรงระหว่างตัวแปรตามค่าสัมบูรณ์ได้ การเชื่อมต่อเหล่านี้แสดงเป็นเส้นตรงแบบกราฟิก จึงเป็นที่มาของชื่อ "เชิงเส้น"

    ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นถูกกำหนดโดยใช้สูตรต่อไปนี้ 31:

    ที่ไหน r xy - สัมประสิทธิ์สหสัมพันธ์เชิงเส้น

    เอ็กซ์ ย -ค่าตัวอย่างเฉลี่ยของค่าที่เปรียบเทียบ

    เอ็กซ์ ฉัน ,ย ฉัน - ค่าตัวอย่างส่วนตัวของปริมาณที่เปรียบเทียบ

    พี -จำนวนค่าทั้งหมดในชุดตัวบ่งชี้ที่เปรียบเทียบ

    การกระจายตัวการเบี่ยงเบนของค่าที่เปรียบเทียบจากค่าเฉลี่ย

    ความสัมพันธ์ของอันดับเป็นตัวกำหนดการพึ่งพาไม่ได้ระหว่างค่าสัมบูรณ์ของตัวแปร แต่ระหว่างตำแหน่งลำดับหรืออันดับที่ถูกครอบครองโดยพวกมันในชุดเรียงลำดับตามค่า สูตรสำหรับค่าสัมประสิทธิ์สหสัมพันธ์อันดับมีดังนี้ 32:

    โดยที่ R s คือสัมประสิทธิ์สหสัมพันธ์อันดับสเปียร์แมน

    ฉัน - ความแตกต่างระหว่างอันดับตัวบ่งชี้ของวิชาเดียวกันตามลำดับ

    พี -จำนวนวิชาหรือข้อมูลดิจิทัล (อันดับ) ในชุดที่สัมพันธ์กัน

    วัตถุประสงค์ของบทเรียน:
    - การสร้างเงื่อนไขสำหรับการเรียนรู้หัวข้อในระดับความเข้าใจและการท่องจำเบื้องต้น
    - เพื่อพัฒนาความสามารถทางคณิตศาสตร์ของบุคลิกภาพของนักเรียน

    วัตถุประสงค์ของบทเรียน
    เกี่ยวกับการศึกษา:สร้างแนวคิดทางสถิติในฐานะวิทยาศาสตร์ ทำให้นักเรียนคุ้นเคยกับแนวคิดเกี่ยวกับลักษณะทางสถิติพื้นฐาน พัฒนาความสามารถในการค้นหาช่วงและโหมดของซีรีส์ วิเคราะห์ข้อมูล และพัฒนาทักษะการคำนวณทางจิต
    เกี่ยวกับการศึกษา:ส่งเสริมการเรียนรู้แนวคิดและการตีความ การพัฒนาทักษะเหนือวิชาในการวิเคราะห์ การเปรียบเทียบ การจัดระบบและลักษณะทั่วไป ดำเนินการสร้างภาษาประจำวิชาต่อไป ส่งเสริมการก่อตัวของความสามารถหลัก (ความรู้ความเข้าใจ ข้อมูล การสื่อสาร) ในขั้นตอนต่างๆ ของบทเรียน ส่งเสริมการสร้างภาพทางวิทยาศาสตร์ที่เป็นหนึ่งเดียวของโลกในหมู่นักเรียนโดยระบุความเชื่อมโยงแบบสหวิทยาการระหว่างสถิติและวิทยาศาสตร์ต่างๆ
    เกี่ยวกับการศึกษา:ปลูกฝังความสนใจในเรื่องที่กำลังศึกษาวัฒนธรรมสารสนเทศ ความพร้อมในการปฏิบัติตามบรรทัดฐานและกฎเกณฑ์ที่เป็นที่ยอมรับโดยทั่วไป มีประสิทธิภาพและองค์กรสูง

    เทคโนโลยีที่ใช้: เทคโนโลยีการเรียนรู้ที่เน้นผู้เรียนเป็นศูนย์กลาง เทคโนโลยีสารสนเทศและการสื่อสาร
    อุปกรณ์ที่จำเป็น, วัสดุ: โปรเจคเตอร์มัลติมีเดีย คอมพิวเตอร์ ไวท์บอร์ดแบบโต้ตอบ

    ในระหว่างเรียน

    1. ช่วงเวลาขององค์กร

    การตรวจสอบความพร้อมของนักเรียนในชั้นเรียน

    การตรวจสอบการเข้าร่วม

    2. การตั้งเป้าหมาย

    เหตุผลความจำเป็นในการศึกษาหัวข้อนี้

    ให้นักเรียนมีส่วนร่วมในกระบวนการกำหนดเป้าหมายบทเรียน

    เราได้รับและรวบรวมข้อมูลจากแหล่งใด (คำตอบที่แนะนำ: วิทยุ โทรทัศน์ หนังสือพิมพ์ นิตยสาร โทรศัพท์ บุคคล อินเทอร์เน็ต จดหมาย)

    ผู้คนเก็บข้อมูลไว้ที่ไหน? (คำตอบที่แนะนำ. : ในหน่วยความจำและสื่อภายนอก)
    การเรียนที่โรงเรียนเทคนิคเกี่ยวกับการรับข้อมูลหรือไม่? ที่โรงเรียนคุณเรียนวิชาการศึกษาทั่วไป แต่เมื่อคุณเรียนที่โรงเรียนเทคนิค คุณจะได้อะไรอีกบ้าง (คำตอบที่แนะนำ: ส ความรู้ทางวิชาชีพ)ยิ่งเราเรียนรู้มากเท่าไร ข้อมูลในความทรงจำของเราก็จะยิ่งมีมากขึ้นเท่านั้น

    วันนี้ผมขอเสนอข้อมูลอีกชิ้นหนึ่งให้กับคุณ คุณได้รับการฝึกอบรมให้เป็นผู้ปฏิบัติงานเหมืองแร่ คุณจะทำงานกับรถขุด EKG-8I ประสิทธิภาพของรถขุดนี้คืออะไร ตามคำขอของฉัน โรงงานได้ให้ข้อมูลต่อไปนี้แก่ฉัน (ประสิทธิภาพของรถขุด - ตาราง)

    โดยเศษหิน (พันตัน)

    เพื่อนๆ ข้อมูลเยอะดีมั้ย? ข้อมูลทั้งหมดจะมีประโยชน์และมีคุณภาพสูงได้หรือไม่? เราควรทำอย่างไรเพื่อไม่ให้หลงเข้าไปในเขาวงกตของข้อมูล? (คำตอบที่คาดหวังของนักเรียน: “ต้องสามารถแยกข้อมูลที่เป็นประโยชน์และมีคุณภาพสูงออกจากข้อมูลที่มีคุณภาพต่ำได้”) เหล่านั้น. สามารถประมวลผลได้

    สรุป: วันนี้ในบทเรียนเราจะเรียนรู้การประมวลผลข้อมูล

    3. การจัดกิจกรรมเพื่อศึกษาเนื้อหาใหม่(นักเรียนจดบันทึกในสมุดบันทึกและทำงานที่ได้รับมอบหมายในระหว่างกระบวนการอธิบาย)

    1. คำจำกัดความของสถิติ

    สถิติคืออะไร? ว่ากันว่านายกรัฐมนตรีอังกฤษ เบนจามิน ดิสเรลี (พ.ศ. 2347 - 2424) ตอบคำถามนี้ดังนี้: "การโกหกมีสามประเภท: การโกหก การโกหกสาปแช่ง และสถิติ"

    สถิติเป็นวิทยาศาสตร์ที่แน่นอนที่ศึกษาวิธีการรวบรวม วิเคราะห์ และประมวลผลข้อมูลที่อธิบายการกระทำ ปรากฏการณ์ และกระบวนการของมวล

    (อ่านข้อความที่ตัดตอนมาจากนวนิยายเรื่อง "The Twelve Chairs" โดย Ilf และ Petrov

    “ สถิติรู้ทุกอย่าง” เป็นที่รู้กันว่าพลเมืองโดยเฉลี่ยของสาธารณรัฐกินอาหารได้มากเพียงใดต่อปี: เป็นที่รู้กันว่ามีนักล่านักบัลเล่ต์กี่คน: เครื่องจักร, จักรยาน, อนุสาวรีย์, ประภาคารและจักรเย็บผ้าในประเทศ: ชีวิตเต็มอิ่มแค่ไหน ความกระตือรือร้น ความหลงใหล และความคิด มองเราจากตารางสถิติ!..”

    ชื่อของมันมาจากคำภาษาละติน "สถานะ" - รัฐจากรากนี้คำว่า stato (อิตาลี), statistik (เยอรมัน), รัฐ (อังกฤษ) - รัฐ

    การศึกษาสถิติ:

    เป้าหมายหลักของการศึกษาองค์ประกอบของสถิติ:

    • จำนวนกลุ่มประชากรแต่ละกลุ่มของประเทศและภูมิภาค
    • การผลิตและการบริโภคผลิตภัณฑ์ประเภทต่างๆ
    • การขนส่งสินค้าและคนโดยสารด้วยการขนส่งรูปแบบต่างๆ
    • ทรัพยากรธรรมชาติ และอื่นๆ อีกมากมาย

    คุณรู้หรือไม่ว่าการปฏิบัติทางสถิติในประเทศใดเริ่มต้นขึ้น (ในประเทศจีน) การสำรวจสำมะโนประชากรครั้งแรกของประเทศมีอายุย้อนกลับไปในศตวรรษที่ 5 II สหัสวรรษก่อนคริสต์ศักราช

    ในศตวรรษที่ 19 มีความเป็นไปได้ที่จะประมวลผลข้อมูลโดยใช้สูตร กฎทางคณิตศาสตร์ และคุณลักษณะพิเศษ นี้?.... ( เสื่อ. สถิติ).

    2. สถิติทางคณิตศาสตร์

    สถิติทางคณิตศาสตร์เป็นสาขาวิชาคณิตศาสตร์ที่ศึกษาวิธีการรวบรวม จัดระบบ และประมวลผลผลการสังเกตปรากฏการณ์มวลสุ่มเพื่อระบุรูปแบบที่มีอยู่

    แล้วทำไมดิสเรลีถึงเปรียบเทียบสถิติกับการโกหก? (ไม่มีการประมวลผลข้อมูลทางวิทยาศาสตร์ที่เข้มงวด ข้อมูลถูกตีความโดยใครก็ตามที่ต้องการ)

    สถิติทางคณิตศาสตร์มีวิธีการประมวลผลข้อมูลที่เป็นสากล
    นี่คือสิ่งที่ทำให้ฮีโร่ของภาพยนตร์เรื่อง "Office Romance" พูดคำต่อไปนี้เกี่ยวกับสถิติ ( ส่วนหนึ่งของภาพยนตร์เรื่อง "Office Romance").
    สรุป: สถิตินำข้อมูลเข้าสู่ระบบ

    3. การแสดงข้อมูลแบบกราฟิก

    รูปหลายเหลี่ยมการกระจาย

    ฮิสโตแกรมการกระจาย

    แผนภูมิวงกลม

    4. ลักษณะการวัด
    1. ชุดข้อมูลคือชุดผลลัพธ์ของการวัดใดๆ

    ตัวอย่างเช่น: 1) การวัดความสูงของมนุษย์

    2) การวัดน้ำหนักมนุษย์ (สัตว์)

    3) ค่ามิเตอร์ (ไฟฟ้า, น้ำ, ความร้อน...)

    4) ผลการแข่งขันในระยะ 100 เมตร

    2. ปริมาตรของชุดข้อมูล - ปริมาตรของชุดข้อมูลคือจำนวนข้อมูลทั้งหมด

    ตัวอย่างเช่น:ให้ชุดตัวเลข 1; 3; 6; -4; 0

    ปริมาตรของมันจะเท่ากับ 5 ทำไม?

    3. ช่วงของชุดข้อมูลคือความแตกต่างระหว่างตัวเลขที่ใหญ่ที่สุดและน้อยที่สุดจากชุดข้อมูล

    ตัวอย่างเช่น:ถ้าได้รับชุดตัวเลข 1; 3; 6; -4; 0; 2 แล้ว ขอบเขตชุดข้อมูลนี้จะเท่ากับ 6 (เนื่องจาก 6 - 0 = 6)

    4. โหมดของชุดข้อมูล - โหมดของชุดข้อมูลคือจำนวนชุดข้อมูลที่เกิดขึ้นบ่อยที่สุดในชุดข้อมูลนี้

    ตัวอย่างเช่น: น Data Poison อาจมีหรือไม่มีโหมดก็ได้

    ดังนั้น ในชุดข้อมูล 47, 46, 50, 52, 47, 52, 49, 45, 43, 53 แต่ละหมายเลข 47 และ 52 เกิดขึ้นสองครั้ง และตัวเลขที่เหลือน้อยกว่าสองครั้ง ในกรณีเช่นนี้ มีการตกลงกันว่าซีรีส์นี้มีสองโหมด: 47 และ 52

    5. ค่ามัธยฐานของซีรีส์

    ค่ามัธยฐานที่มีพจน์เป็นเลขคี่คือตัวเลขที่เขียนไว้ตรงกลาง

    ค่ามัธยฐานที่มีพจน์เป็นจำนวนคู่ - นี่คือค่าเฉลี่ยเลขคณิตของตัวเลขสองตัวที่เขียนไว้ตรงกลาง

    ตัวอย่างเช่น: กำหนดค่ามัธยฐานของชุดตัวเลข

    16; -4; 5; -2; -3; 3; 3; -2; 3. คำตอบ: -3

    2) -1; 0; 2; 1; -1; 0;2; -1. คำตอบ: 0

    6. ค่าเฉลี่ยเลขคณิตคือผลหารของการหารผลรวมของตัวเลขในชุดด้วยตัวเลข

    ตัวอย่างเช่น: ให้ชุดตัวเลข -1; 0; 2; 1; -1; 0; 2; -1. จากนั้นค่าเฉลี่ยเลขคณิตจะเท่ากับ: (-1+0+2+1+(-1)+0+2+(-1)): 8 = 2: 8 = 0.25

    4. การรวมเนื้อหาที่ศึกษา

    การปฏิบัติงาน

    ออกกำลังกาย:อธิบายลักษณะการปฏิบัติงานของนักเรียน Peter Ivanov ในวิชาคณิตศาสตร์สำหรับไตรมาสที่สี่

    เสร็จสิ้นการทำงาน:

    1. การรวบรวมข้อมูล:

    เกรดที่เขียนจากนิตยสารคือ: 5,4,5,3,3,5,4,4,4

    2. การประมวลผลข้อมูลที่ได้รับ:

    การบรรยายครั้งที่ 12 วิธีการประมวลผลผลลัพธ์ทางสถิติ

    วิธีการประมวลผลผลลัพธ์ทางสถิติเรียกว่าเทคนิคทางคณิตศาสตร์สูตรวิธีการคำนวณเชิงปริมาณด้วยความช่วยเหลือซึ่งตัวบ่งชี้ที่ได้รับระหว่างการทดลองสามารถสรุปได้นำเข้าสู่ระบบโดยเปิดเผยรูปแบบที่ซ่อนอยู่ในตัวพวกเขา เรากำลังพูดถึงรูปแบบของลักษณะทางสถิติที่มีอยู่ระหว่างตัวแปรที่ศึกษาในการทดลอง

    1. วิธีการประมวลผลทางสถิติเบื้องต้นของผลการทดลอง

    วิธีการวิเคราะห์ทางคณิตศาสตร์และสถิติทั้งหมดแบ่งออกเป็นระดับประถมศึกษาและมัธยมศึกษาตามอัตภาพ วิธีการหลักคือวิธีการที่ใช้เพื่อให้ได้ตัวบ่งชี้ที่สะท้อนผลการวัดที่ทำในการทดลองโดยตรง ดังนั้น โดยตัวบ่งชี้ทางสถิติหลัก เราหมายถึงตัวบ่งชี้ที่ใช้ในวิธีวินิจฉัยทางจิตเวชและเป็นผลมาจากการประมวลผลทางสถิติเบื้องต้นของผลการวินิจฉัยทางจิต วิธีรองเรียกว่าวิธีการประมวลผลทางสถิติด้วยความช่วยเหลือซึ่งรูปแบบทางสถิติที่ซ่อนอยู่ในนั้นจะถูกเปิดเผยบนพื้นฐานของข้อมูลหลัก

    วิธีการหลักของการประมวลผลทางสถิติได้แก่ การหาค่าเฉลี่ยตัวอย่าง ความแปรปรวนของตัวอย่าง โหมดตัวอย่าง และค่ามัธยฐานของตัวอย่าง วิธีรองมักจะรวมถึงการวิเคราะห์สหสัมพันธ์ การวิเคราะห์การถดถอย และวิธีการเปรียบเทียบสถิติปฐมภูมิในกลุ่มตัวอย่างตั้งแต่สองตัวอย่างขึ้นไป

    พิจารณาวิธีการคำนวณสถิติทางคณิตศาสตร์เบื้องต้น

    แฟชั่นพวกเขาเรียกค่าเชิงปริมาณของคุณลักษณะที่กำลังศึกษาซึ่งมักพบในตัวอย่าง

    ค่ามัธยฐานคือค่าของคุณลักษณะที่กำลังศึกษาโดยแบ่งกลุ่มตัวอย่างโดยเรียงลำดับตามค่าของคุณลักษณะนี้ครึ่งหนึ่ง

    ค่าเฉลี่ยตัวอย่าง(ค่าเฉลี่ยเลขคณิต) เป็นตัวบ่งชี้ทางสถิติแสดงถึงการประเมินโดยเฉลี่ยของคุณภาพทางจิตวิทยาที่ศึกษาในการทดลอง

    กระจาย(บางครั้งค่านี้เรียกว่าช่วง) ของกลุ่มตัวอย่างจะแสดงด้วยตัวอักษร R นี่เป็นตัวบ่งชี้ที่ง่ายที่สุดที่สามารถหาได้สำหรับตัวอย่าง - ความแตกต่างระหว่างค่าสูงสุดและต่ำสุดของชุดรูปแบบเฉพาะนี้

    การกระจายตัวคือค่าเฉลี่ยเลขคณิตของการเบี่ยงเบนกำลังสองของค่าของตัวแปรจากค่าเฉลี่ย

    2. วิธีการประมวลผลทางสถิติทุติยภูมิของผลการทดลอง

    ด้วยความช่วยเหลือของวิธีรองในการประมวลผลข้อมูลการทดลองทางสถิติ สมมติฐานที่เกี่ยวข้องกับการทดลองจะได้รับการทดสอบ พิสูจน์ หรือหักล้างโดยตรง ตามกฎแล้ววิธีการเหล่านี้มีความซับซ้อนมากกว่าวิธีการประมวลผลทางสถิติเบื้องต้น และกำหนดให้ผู้วิจัยต้องได้รับการฝึกอบรมอย่างดีในด้านคณิตศาสตร์และสถิติเบื้องต้น

    กลุ่มวิธีการภายใต้การสนทนาสามารถแบ่งออกเป็นกลุ่มย่อยได้หลายกลุ่ม:

    1 แคลคูลัสการถดถอย

    แคลคูลัสการถดถอยเป็นวิธีการหนึ่งของสถิติทางคณิตศาสตร์ที่ทำให้สามารถลดข้อมูลส่วนตัวที่กระจัดกระจายลงเหลือเพียงกราฟเชิงเส้นบางกราฟที่สะท้อนถึงความสัมพันธ์ภายในโดยประมาณ และสามารถประมาณค่าที่เป็นไปได้ของตัวแปรอื่นโดยอิงจากค่าของหนึ่งในนั้น ตัวแปร

    2.สหสัมพันธ์

    วิธีถัดไปของการประมวลผลทางสถิติรองซึ่งมีการกำหนดการเชื่อมต่อหรือการพึ่งพาโดยตรงระหว่างข้อมูลการทดลองสองชุดเรียกว่าวิธีความสัมพันธ์ มันแสดงให้เห็นว่าปรากฏการณ์หนึ่งมีอิทธิพลหรือเกี่ยวข้องกับปรากฏการณ์อื่นอย่างไรในพลวัตของมัน มีการพึ่งพาประเภทนี้อยู่ เช่น ระหว่างปริมาณที่อยู่ในความสัมพันธ์ระหว่างเหตุและผลซึ่งกันและกัน หากปรากฏว่าปรากฏการณ์ทั้งสองมีความสัมพันธ์กันอย่างมีนัยสำคัญทางสถิติ และหากมีความมั่นใจว่าปรากฏการณ์หนึ่งสามารถเป็นสาเหตุของอีกปรากฏการณ์หนึ่งได้ สรุปได้ว่า มีความสัมพันธ์ระหว่างเหตุและผลอย่างแน่นอน ดังต่อไปนี้

    3 การวิเคราะห์ปัจจัย

    การวิเคราะห์ปัจจัยเป็นวิธีการทางสถิติที่ใช้ในการประมวลผลข้อมูลการทดลองจำนวนมาก วัตถุประสงค์ของการวิเคราะห์ปัจจัยคือ การลดจำนวนตัวแปร (การลดข้อมูล) และการกำหนดโครงสร้างความสัมพันธ์ระหว่างตัวแปร ได้แก่ การจำแนกตัวแปร ดังนั้น การวิเคราะห์ปัจจัยจึงใช้เป็นวิธีการลดข้อมูลหรือวิธีการจำแนกโครงสร้าง

    ทบทวนคำถาม

    1.วิธีการประมวลผลทางสถิติคืออะไร?

    2.กลุ่มย่อยใดบ้างที่เป็นวิธีรองของการประมวลผลทางสถิติแบ่งออกเป็น?

    3.อธิบายสาระสำคัญของวิธีสหสัมพันธ์ได้อย่างไร

    4. ในกรณีใดบ้างที่ใช้วิธีการประมวลผลทางสถิติ?

    5. คุณคิดว่าการใช้วิธีประมวลผลทางสถิติในการวิจัยทางวิทยาศาสตร์มีประสิทธิผลเพียงใด

    2. พิจารณาคุณสมบัติของวิธีการประมวลผลข้อมูลทางสถิติ

    วรรณกรรม

    1.. กอร์บาตอฟ ดี.เอส. การประชุมเชิงปฏิบัติการเรื่องการวิจัยทางจิตวิทยา: Proc. เบี้ยเลี้ยง. - Samara: "BAKHRAH - M", 2546 - 272 หน้า

    2. Ermolaev A.Yu. สถิติทางคณิตศาสตร์สำหรับนักจิตวิทยา - อ.: สถาบันจิตวิทยาและสังคมแห่งมอสโก: Flinta, 2003.336p

    3. คอร์นิโลวา ทีวี การทดลองทางจิตวิทยาเบื้องต้น หนังสือเรียนสำหรับมหาวิทยาลัย อ.: สำนักพิมพ์ CheRo, 2544.