chinhcoi195's Blog

 

Bộ dữ liệu 93CARS chứa thông tin về 93 xe mới cho năm mẫu năm 1993. Các biện pháp đưa ra bao gồm giá, mpg xếp hạng, DÁN KÍNH XE Ô TÔ LOẠI TỐT kích thước động cơ, kích thước cơ thể, và các chỉ số của các tính năng. 26 biến số trong tập dữ liệu cung cấp đầy đủ sự đa dạng để minh họa cho một loạt các kỹ thuật thống kê thường thấy trong các khóa học giới thiệu.

 

 

Từ khoá: Ô tô ,  Dữ liệu lớp học ,  Tập dữ liệu ,  Số liệu thống kê giới thiệu

1. Giới thiệu

1 Dữ liệu xe mới năm 1993 được lấy cảm hứng từ một bộ dữ liệu tương tự cho mẫu xe mẫu năm 1989 đã được đưa vào trong số các dữ liệu mẫu cho Student Edition of Execustat Sinh viên của Execustat ( 1990 ), Boston, MA : Công ty Xuất bản PWS-KENT

 [Google Scholar]

 (PWS-KENT 1990). Chúng tôi đã sử dụngdữ liệu CARS89 củaExecustatđể chứng minh nhiều điểm trong các lớp học giới thiệu và cấp hai về thống kê áp dụng. Dưới đây chúng tôi đưa ra một mô tả ngắn gọn về bộ dữ liệu 93CARS cập nhật và mở rộng và đề xuất một số cách nó có thể được sử dụng trong lớp.

 

2. Nguồn dữ liệu

2 Số liệu thu được từ hai nguồn, Số ô tô năm 1993 - Số phát hành hàng năm Báo cáo của Người tiêu dùng: Báo cáo Ô tô hàng năm năm 1993 (Tháng 4 năm 1993 ), Yonkers, NY : Consumer Consumers Union .

 [Google Scholar]

 từBáo cáo Người tiêu dùngvàHướng dẫn Mua xe tảicủaPACE năm 1993 Hướng dẫn mua xe mới của PACE năm 1993 ( 1993 ), Milwaukee, WI : Pace Publications Inc.

 [Google Scholar]

 . Xe ô tô chở khách hoặc xe tải đã được đưa vào cả hai nguồn đều có đủ điều kiện để lựa chọn. Một mẫu ngẫu nhiên của các mô hình được đưa ra trongHướng dẫn mua PACEđã được chọn và kết hợp với ô tô được đề cập trongBáo cáo Người tiêu dùngcho tới khi đạt tới một mẫu có mong muốn là 93. Phương tiện trong danh mục Xe bán tải và Thể thao / Tiện ích đã bị loại trừ do thông tin chưa đầy đủ trongbàibáo Người tiêu dùng. Chúng tôi cũng tránh được sự bao trùm nhiều loại xe hơi có cùng kiểu dáng (chẳng hạn như Dodge Shadow và Plymouth Sundance).

 

3. Mô tả của dữ liệu

3 Mỗi trường hợp dữ liệu bắt đầu bằng SẢN XUẤT (ví dụ: Chevrolet, Audi, Honda, ...), MODEL (ví dụ Caprice, 90, Accord, ...) và Loại TYPE (Nhỏ, Thể thao, Nhỏ gọn, Xe cỡ trung, Vân). Các loại được xác định bởi phân loại Báo cáo Người tiêu dùng . 23 biến khác đều là số. Ba biến PRICE cho một chi phí "tối thiểu" cho một mô hình cơ bản, "tối đa" cho một mô hình được trang bị nhiều lựa chọn, và một mức trung bình là mức trung bình của hai cực đoan. Xếp hạng hiệu quả sử dụng nhiên liệu của EPA được cho là cả hai CITY và HIGHWAY miles per gallon (MPG).

 

4 Một số biện pháp phản ánh kích thước tương đối và sức mạnh của động cơ tiêu chuẩn. Chúng bao gồm số xi lanh, dung tích xylanh của động cơ SIZE (tính bằng lít), tốc độ tối đa của HORSEPOWER và tốc độ vòng / phút (RPM) ở đó công suất cực đại đạt được. Một biện pháp có thể ít quen thuộc với hầu hết sinh viên là số REVOLUTIONS của động cơ cần thiết cho chiếc xe để đi một dặm trong hộp số cao nhất của nó (truyền tự động).

 

5 Chỉ định kích cỡ của mỗi chiếc xe là LENGTH, WIDTH, WHEELBASE, đường kính U-TURN, phòng ghế REAR, dung tích LUGGAGE, và kích thước của bể chứa FUEL. Trọng lượng xe hơi khác nhau giữa hai nguồn dữ liệu. Chúng tôi đã sử dụng TRỌNG LƯỢNG do Báo cáo Người tiêu dùng đưa ra trong đó bao gồm một bình xăng đầy đủ và điều hòa không khí, nếu có.

 

6 Các biến số khác lưu ý sự hiện diện của AIR BAGS tiêu chuẩn (lái xe hoặc hành khách), loại DRIVETRAIN (bánh trước, Phim cách nhiệt xe ô tô bánh sau hoặc toàn bộ bánh xe) và một tùy chọn cho một truyền MANUAL. Một biến cuối cùng phân loại nhà sản xuất là trong nước (Hoa Kỳ) hoặc nước ngoài, mặc dù sự khác biệt ngày càng trở nên ít rõ ràng hơn.

 

7 Các giá trị còn lại chỉ dành cho CYLINDERS trong động cơ rotary Mazda RX-7, phòng REAR SEAT cho hai chỗ ngồi (Corvette và RX-7) và khả năng LUGGAGE cho xe van và hai chỗ ngồi.

 

8 Một khóa chi tiết cho các biến trong tệp có thể tìm thấy trong Phụ lục và tệp 93cars.txt có sẵn trong kho lưu trữ dữ liệu.

 

4. Sử dụng sư phạm

9 Đây là một bộ dữ liệu đa năng có thể được sử dụng tại nhiều điểm trong một khóa học. Chúng tôi thường sử dụng Execustatdữ liệu CARS89 tương tự như một ví dụ ban đầu cho việc trình diễn gói thống kê cho sinh viên trong tuần thứ hai của khóa học giới thiệu. Lớp học này thường được tổ chức trong lớp học được trang bị máy tính và hệ thống chiếu, với hướng dẫn "lái xe" phần mềm. Mặc dù đã chỉ nghiên cứu một số kỹ thuật mô tả, sinh viên có thể dễ dàng rút ra một cuộc thảo luận về các tính năng thú vị của dữ liệu. Họ có xu hướng quen thuộc với hầu hết các biến số (và các mẫu xe cụ thể). Họ dự đoán mối quan hệ giữa các biến số, nhanh chóng tạo ra cả hai câu hỏi và giải thích, và tận hưởng đoán vào danh tính của các ngoại lệ trong các lô. Chắc chắn, giai đoạn lớp kết thúc rất lâu trước khi dòng câu hỏi đã cạn.

 

10 Ngoài các biến số số tốt, dữ liệu còn cung cấp một số tùy chọn thú vị để chia ô tô thành các nhóm so sánh khác nhau (ví dụ: DOMESTIC, TYPE, AIRBAGS, DRIVETRAIN hoặc MANUAL transmission). Hầu hết các phân tích ban đầu của chúng tôi chỉ sử dụng các số liệu thống kê tóm tắt cơ bản hoặc đồ hoạ, tuy nhiên một cuộc thảo luận về các ô vuông góc của đường cao tốc MPG cho các nhà sản xuất nội địa so với các nhà sản xuất nước ngoài đã tạo ra nền tảng tốt cho các công trình sau này, chính thức hơn, Vì những kỹ thuật này được phát triển sau đó, chúng tôi có thể tiếp tục quay lại dữ liệu xe - thiết lập một chủ đề quen thuộc có thể chạy xuyên suốt khóa học. Chúng tôi không phải lúc nào cũng phải "trực tuyến" trong một phiên làm việc máy tính để sử dụng dữ liệu. Thông thường một số thống kê tóm tắt có thể là tất cả những gì được yêu cầu để thúc đẩy một ví dụ.

 

11 Có thể mong đợi, có rất nhiều mối quan hệ giữa các biến cung cấp các ví dụ tuyệt vời để thảo luận các kỹ thuật phân tán, tương quan và hồi quy. Người ta có thể dễ dàng tìm ra các cặp biến thể biểu hiện sự liên kết mạnh hoặc yếu, tích cực hoặc tiêu cực. Các biến PRICE và MPG có xu hướng trở thành các lựa chọn phổ biến như các biến phụ thuộc trong nghiên cứu các mô hình hồi quy, mặc dù sinh viên cần phải chú ý đến việc tiếp cận nhiều tình huống hồi quy vì nhiều yếu tố dự báo tiềm năng thường có mối tương quan cao.

 

12 Chúng tôi kết luận bằng cách gợi ý một số cách cụ thể dữ liệu có thể được sử dụng để minh họa các chủ đề nhất định. Một ít thời gian dành để khám phá dữ liệu sẽ nhanh chóng kích thích các khả năng bổ sung.

 

13 Ranh giới hộp : Giá hoặc biến Phim cách nhiệt nhà kính MPG đưa ra những ví dụ điển hình về các dữ liệu sai lệch với các hàng rào tiềm ẩn trong hàng rào trên.

 

14 Khoảng tin cậy mẫu nhỏ cho một nghĩa : Xem HPW hoặc RPM trong một loại xe. Các sinh viên khác nhau có thể được giao TYPE khác nhau.

 


 

 Trả lời nhanh
Nhập vào tên của bạn:
Nhập mã số xác nhận (bắt buộc):
» Hiển thị cửa sổ mặt cười       » Download bộ gõ tiếng Việt Unikey
 Bạn có muốn chuyển các ký hiệu như :) :( :D ...thành mặt cười trong bài viết này?
 Bạn có muốn chèn thêm chữ ký vào bài viết này ?
 


 
Thông tin cá nhân

chinhcoi195
Trạng thái: User is offline (Vắng mặt)
Thêm vào nhóm bạn bè
Gửi tin nhắn

CHBTNSB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30



(♥ Góc Thơ ♥)

Tik Tik Tak

Truyện cười

Tin nhanh

Xem theo danh mục
Xem theo danh mục:
Blog chưa có danh mục nào.

Tìm kiếm:
     

Lượt xem thứ:





Mạng xã hội của người Việt Nam.
VnVista I-Shine © 2005 - 2024   VnVista.com