Thống kê là một ngành thuộc khoa học Toán học. Nhiệm vụ của thống kê là thu thập, phân tích, suy luận hoặc giải thích, và biểu diễn các số liệu (data). Ngoài ra thống kê cũng có nhiệm vụ dự báo (prediction and forecasting) từ việc phân tích số liệu. Thống kê được ứng dụng rộng rãi trong các ngành khoa học tự nhiên, khoa học xã hội, trong nghiên cứu con người, trong công tác điều hành quản lý chính phủ, trong kinh doanh, ...
Thống kê học được phân chia thành 2 nhánh chính:
- Thống kê mô tả (Descriptive statistics): nghiên cứu việc tổng hợp, số hóa, biểu diễn bằng đồ thị các số liệu thu thập được. Sau đó tính toán các tham số đặc trưng cho tập hợp dữ liệu như: trung bình, phương sai, tần suất, tỷ lệ, ...Mục đích là để mô tả tập dữ liệu đó.
- Thống kê suy luận (Inferential statistics): nghiên cứu sự ngẫu nhiên, sai số của các tập dữ liệu, từ đó mô hình hóa và đưa ra các suy luận cho tập tổng thể. Các suy luận này có thể là: trả lời đúng / sai cho các giả thuyết đặt ra (kiểm định giả thuyết thống kê), ước lượng các tham số của tổng thể (ước lượng), mô tả sự tác động qua lại giữa các biến số (tương quan), mô hình hóa quan hệ giữa các biến số (hồi quy), nội suy các giá trị không thể quan sát được (extrapolation, interpolation). Các kỹ thuật mô hình hóa khác trong thống kê suy luận gồm: (M)ANOVA (phân tích phương sai), chuỗi thời gian (time series), và khai phá dữ liệu (data mining).
Khái niệm Toán học căn bản trong nghiên cứu các hiện tượng ngẫu nhiên trong thống kê là lý thuyết xác suất. Toán thống kê, hay còn gọi là lý thuyết thống kê, là 1 nhánh của Toán ứng dụng, trong đó kết hợp xác suất và giải tích để từ đó đưa ra các lý thuyết cơ bản của Thống kê. Đối tượng nghiên cứu chủ yếu của lý thuyết thống kê là các ước lượng, bao gồm ước lượng các tham số và ước lượng các hàm phân phối xác suất. Ngoài ra lý thuyết thống kê còn nghiên cứu một cách lý thuyết chất lượng của các ước lượng như độ lệch, sai số ước lượng, sự hội tụ theo luật số lớn của ước lượng,...
Việc sử dụng các phương pháp thống kê chỉ đem lại kết quả đúng nếu như tập tổng thể xem xét thỏa mãn các giả thuyết Toán học tương ứng với phương pháp đó. Việc lạm dụng các phương pháp thống kê mà không kiểm tra các giả thuyết Toán học có thể dẫn đến sai lầm ngiêm trọng trong việc mô tả và suy luận số liệu. Các sai lầm này càng nghiêm trọng đối với các ứng dụng trong y học, trong kinh tế chính trị hoặc trong tính toán xây dựng, ...
Một số phân ngành trong Thống kê ứng dụng:
- Khoa học bảo hiểm (actuarial science): nghiên cứu về rủi ro trong bảo hiểm, tài chính, ...
- Sinh thống kê: phân tích các số liệu sinh học.
- Hóa thống kê: Phân tích các số liệu hóa học
- Phân tích số liệu (data analysis): tổng hợp, mô hình hóa, chọn lọc thông tin, từ đó đưa ra các kết luận, quyết định hoặc điều chỉnh các quyết định trước đó.
- Khai khá dữ liệu (data mining): là một chuyên ngành của phân tích số liệu (data analysis), mục đích là khai phá các thông tin khác tiềm ẩn thông qua số liệu đo được. Các ngành nhỏ của khai phá dữ liệu gồm: phân loại (classification), phân nhóm (clustering), hồi quy (regression), ... Khai phá dữ liệu được ứng dụng nhiều trong các ngành nghiên cứu tiếp thị thị trường (marketing), đặc biệt là tiếp thị địa lý (geomarketing), chẩn đoán phân loại trong y sinh học, ...
- Kinh tế lượng: ứng dụng các phương pháp thống kê trong việc tính toán, mô hình hóa các đại lượng và các quy luật kinh tế.
- Địa lý thống kê: nghiên cứu về cơ cấu và chuyển động của dân số.
- Thống kê năng lượng (Energy statistics): tổng hợp, phân tích các số liệu về năng lượng trên lãnh thổ quốc gia hoặc thế giới như dầu, khí ga, điện, và các nguồn năng lượng sạch (gió, mặt trời, ...). Mục đích là đìều tiết, dự báo, ngăn ngừa các cuộc khủng hoảng năng lượng.
- Thống kê kỹ thuật (Engineering statistics): xây dựng thực nghiệm, quản lý chất lượng, quản lý quá trình sản xuất, hạn chế rủi ro trong xây dựng, thiết kế hệ thống.
- Dịch tễ học: nghiên cứu sai số trong dự báo, dự đoán bệnh, khả năng lây bệnh, hiệu quả của thuốc, ...
- Khí tượng và hải dương học: nghiên cứu các hiện tượng thời tiết, các nhân tố trong khí quyển như độ ẩm, nhiệt độ, trên mặt nước biển như nhiệt độ mặt nước biển, gió, độ cao của sóng, ... từ các quan sát thu được (từ các trạm quan sát, hình ảnh vệ tinh, v.v.), từ đó đưa ra các ước lượng, mô hình hoặc các dự báo. Các nghiên cứu này gắn liền với lý thuyết cơ học chất lỏng (fluid mechanics) và các phương pháp đồng hóa dữ liệu (data asimilation), ...
- Xử lý thông tin (signal processing): thu thập phân tích các thông tin dưới dạng sóng, tín hiệu, hình ảnh, từ đó phân tích, ứng dụng các kỹ thuật thống kê suy luận để sàng lọc, điều chỉnh các thông tin đó. Ví dụ như xử lý các tín hiệu kỹ thuật số, làm rõ hình ảnh, phân tích các chuyển động, nhận diện chuyển động trong các máy quay theo dõi,...
- Thống kê xã hội (Social statistics): dùng các hệ thống đo lường thống kê để nghiên cứu thái độ con người hoặc 1 nhóm người trong môi trường xã hội.
- Mô hình hóa thống kê: nghiên cứu, xây dựng mô hình các quy luật phân phối, chuyển động, phát triển của một hoặc nhiều biến số từ các dữ liệu đo được.
- ...
No comments:
Post a Comment