Đến nội dung

Hình ảnh

Mô hình dữ liệu có ràng buộc

- - - - -

  • Please log in to reply
Chủ đề này có 1 trả lời

#1
hoangtrong2305

hoangtrong2305

    Trảm phong minh chủ

  • Phó Quản lý Toán Ứng dụ
  • 861 Bài viết

Người ta thường yêu cầu các nhà thống kê dự đoán tương lai. Công việc của họ là nhìn vào xu hướng lịch sử, từ đó đưa ra dự đoán những gì sẽ xảy ra ngày mai, hoặc có lẽ trong năm tới. Điều này liên quan đến một quy trình, gọi là ngoại suy. Kiến thức Toán này giúp ta có cái nhìn vào tương lai dựa trên dữ liệu quá khứ.

 

Ví dụ, đây là một tập hợp các dữ liệu bán hàng của công ty (biến $s$) trong thời gian 10 ngày (biến $t$)

mh1-4.PNG

Hãy vẽ đồ thị dữ liệu để ta dễ dàng trong việc đưa ra ý tưởng, như hình dưới:

mh1-1.png

Để thực hiện ngoại suy một cách thông minh, chúng ta cần phải xem xét hình dạng của đường cong dữ liệu, và sau đó thông qua đường cong chúng ta có các điểm phù hợp nhất.

 

Lúc đầu, đồ thị gia tăng nhanh chóng, nhưng sau đó đồ thị san bằng ra (có lẽ là nhân viên bán hàng đã mệt). Dường như đây là một đường cong logarithm vì ở dạng chuẩn, đồ thị logarithm bắt đầu khá dốc và sau đó lại san bằng ra.

 

Ta có nhiều công thức khác nhau để vẽ đường cong đi qua các dữ liệu, nhưng chúng ta sẽ sử dụng phần mềm.

 

Chúng ta sẽ dùng Excel để vẽ một đường cong qua các điểm dữ liệu và sau đó Excel sẽ đưa kết quả ngoại suy cho chúng ta. Sau khi nhập dữ liệu trong Excel, chúng tôi làm nổi bật dữ liệu, sau đó chọn "XY (Scatter)". Khi thấy biểu đồ, ta sẽ lựa chọn các đồ thị và nhấp chuột phải, sau đó chọn "Add trendline". Ta chọn "logarithmic" bởi vì đó là hình dạng của đường cong dữ liệu của chúng ta. Dưới "Options", chúng ta có thể chọn để "Forecast" bao nhiêu lần tùy ý.

 

Vì vậy, trong đồ thị tiếp theo này, bạn sẽ thấy mô hình tăng trưởng theo hàm logarit qua các dữ liệu nhất định. Tôi thực hiện dự báo sản phẩm cho 20 ngày tới, từ đó ta có ý tưởng cho đội ngũ bán hàng nên làm gì trong những ngày còn lại của tháng, giả sử họ vẫn tiếp tục làm việc với hiệu suất như trước đây (trong 10 ngày đầu tiên).

mh1-2.png

(Các thiết lập trên dữ liệu và đường cong nhằm minh họa cho vấn đề.

Chúng ta cần một công thức hiệu quả cho bất kỳ tập dữ liệu nào, công thức đó sẽ được đề cập sau) 

 

ĐIỀU KIỆN RÀNG BUỘC

 

Bây giờ, làm thế nào để tạo ra một đường cong sao cho tổng của các giá trị của đường cong mô hình là chính xác với tổng của các giá trị dữ liệu trong tập dữ liệu ban đầu? (Lấy dữ liệu trong 10 ngày đầu tiên).Ví dụ, ở đây là các dữ liệu, có một hàng mới ($m$) có chứa các giá trị phù hợp với điều kiện ràng buộc trên. Đó là số tiền của 10 giá trị bán hàng đầu tiên (biến $s$) bằng với tổng của 10 giá trị mô hình đầu tiên (sử dụng biến $m$)

mh1-5.PNG

Tổng ( $\mathop{\sum }^{}~$) được đưa ra trong cột cuối cùng . Cả hai dòng $s$ và $m$ đều có tổng là 64.Dưới đây là đồ thị của $m$ - giá trị cho trong bảng trên . Bạn sẽ thấy đồ thị này tương tự như Excel, đó là đồ thị logarithm, nhưng không hoàn toàn giống nhau. Tôi đã một lần nữa ngoại suy thêm 20 bước trong biểu đồ dưới đây. Sử dụng mô hình này, chúng ta buộc rằng doanh số bán mỗi ngày vào cuối tháng là nhỏ hơn (khoảng 11.5) so với đường cong logarithm của Excel (gần 13).

mh1-3.png

Vì vậy, câu hỏi tôi dành cho bạn đó là hãy phát triển một công thức để tạo ra một đường cong đi qua bất kỳ tập hợp các dữ liệu, với điều kiện ràng buộc nêu trên. Chúc may mắn! (Điều này khá khó khăn, nhưng bạn cố gắng nhé!)

 

Nguồn: http://www.intmath.c...u-solve-it-7465

Người dịch: Đỗ Thị Hải Yến - Thành viên Chuyên san EXP


Bài viết đã được chỉnh sửa nội dung bởi hoangtrong2305: 12-11-2015 - 23:45

Toán học là ông vua của mọi ngành khoa học.

Albert Einstein

(1879-1955)

Hình đã gửi


-------------------------------------------------------------------------------------------------------------------


Click xem Đạo hàm, Tích phân ứng dụng được gì?

và khám phá những ứng dụng trong cuộc sống


#2
hoangtrong2305

hoangtrong2305

    Trảm phong minh chủ

  • Phó Quản lý Toán Ứng dụ
  • 861 Bài viết

I. CHUYỆN BÊN LỀ

 

Độc giả Mike Wilde, 78 tuổi có nói rằng:

 

Tôi đã phát triển 3 công thức ngoại suy liên quan vào nhiều năm trước, khi vẫn còn đi làm nhằm giúp tôi dự đoán chi phí trong tương lai. Tôi nghĩ rằng có thể bạn muốn biết.

 

Đây là những gì Mike đã làm với mô hình của ông, tôi đã nhấn mạnh những điểm chính.

 

“Mục tiêu của tôi là xác định một phương pháp thuận lợi cho một chuỗi có tính tương quan, dữ liệu được ghi nhận và xác minh có liên quan đến đặc trung, hoạt động liên tục, không có vấn đề nào thất thường trong khoảng thời gian nhất định (Ví dụ như tăng dân số hay phát sinh các chi phí liên quan đến bộ phận tiếp thị). 

 

Cho những điều kiện ràng buộc sau:

 

1.      Tổng các giá trị đơn của đường cong kết quả sẽ bằng chính xác tổng các giá trị đơn của chuỗi dữ liệu ban đầu.

 

2.      Giả thiết là đường cong này cơ thể được sử dụng lâu dài cho các dự án ở tương lai. (Tất nhiên rằng đường cong này sẽ không xuất hiện giá trị mới khi di chuyển về giá trị cuối cùng trong chuỗi).

 

3.      Tôi cũng tính đến việc xem xét các loại hoạt động có trong đầu không thể tiếp tục mãi và sớm hay muộn phải đạt đến một giai đoạn dù có làm cách mấy vẫn không hơn được gì.

 

4.      Quy trình trên sẽ có một đặc điểm bên trong rằng tổng các giá trị đầu tiên và cuối cùng (${{a}_{1}}$ và ${{f}_{1}}$ trong các công thức kèm theo) sẽ là mức tăng trưởng tối đa theo hướng các đường cong đang tiếp cận, mặc dù các đường cong đó không bao giờ thực sự tiếp cận”

 

II. VÍ DỤ: EXCEL

 

Mike đã gửi đến tôi một bản Excel minh họa mô hình dữ liệu của Mike.

 

Dưới đây là bản tính: Đường cong tăng trưởng lịch sử (tải bản tính tại http://intmstat.com/...pment-curve.xls)

 

Các dữ liệu giống với dữ liệu tôi sử dụng trong phần 1. Dữ liệu này cung cấp cho bạn một ý tưởng về cách mà mô hình hoạt động. Bạn có thể thay đổi dữ liệu trong bảng tính nếu bạn muốn thử các cách khác.

 

Trong bản tính bao gồm dự đoán của Excel.

 

(Trong đồ thị thứ 2 trên bảng tính)

 

III. CÔNG THỨC

 

Dưới đây là các công thức được sử dụng để tạo ra các giá trị trong cột $B$ trong bảng tính:

 

$n=$ số hạng đã cho, chuỗi gốc.

 

$r=$ tốc độ tăng trưởng tăng dần (hoặc giảm dần) của đường cong được phát triển dưới sự trợ giúp của các công thức hiển thị ở trên, trên cơ sở của các số hạng  $n$ đang xét. Tốc độ này là tỷ lệ giữa hai số hạng liên tiếp bất kì chứa trong đường cong tăng dần về 1 và tỉ lệ sai khác giữa số hạng thứ 1 và thứ 2, thứ 2 và thứ 3 của 3 số hạng liên tiếp bất kì chứa trong nó luôn bằng với tỷ lệ tăng (hoặc giảm):

    $$r=\frac{n\left( {{f}_{0}}+{{a}_{0}} \right)-S-{{a}_{0}}}{n\left( {{f}_{0}}+{{a}_{0}} \right)-S-{{f}_{0}}}$$

${{a}_{0}}=$ số hạng đầu tiên trong chuỗi gốc;

 

${{f}_{0}}=$ số hạng cuối hoặc số hạng thứ $n$ trong chuỗi gốc;

 

${{a}_{1}}=$ số hạng đầu tiên của đường cong khai triển bởi công thức gián tiếp;

            $${{a}_{1}}=\frac{s\left( r-1 \right)}{n\left( {{r}^{n-1}}+1 \right)\left( r-1 \right)-{{r}^{n}}+1}$$

${{f}_{1}}=$ số hạng cuối hoặc số hạng thứ $n$ của đường cong khai triển bởi các công thức gián tiếp;

                                                                         $${{f}_{1}}={{a}_{1}}{{r}^{n-1}}$$

$S=$ tổng toàn phần của $n$ số hạng trong đường cong khai triển bởi công thức gián tiếp phải chính xác bằng tổng $n$ số hạng tương ứng trong chuỗi gốc.

 

IV. MÔ HÌNH

 

Các công thức Mike sử dụng nhằm cung cấp các giá trị trong cột $F$ của bảng tính (đường cong màu xanh lá cây) như sau (trong đó số $n$ là số lượng dữ liệu trong cột $D$):

                                                          $${{f}_{1}}+{{a}_{1}}\left( 1-{{r}^{n-1}} \right)$$

V. LỜI BÌNH VỀ CÁC MÔ HÌNH

 

Đâu tiên chúng ta hãy chỉ ra những phần có vẻ làm tốt.

 

Mô hình của Mike chắc chắn thỏa đặc điểm đầu tiên, đó là tổng các điểm dữ liệu đã cho tương tự như tổng các điểm ban đầu. (Cả hai đều là 64 trong trường hợp cho trước dữ liệu mặc định.)

 

Xét đặc điểm thứ 3, tốc độ biến thiên trở nên ít hơn theo dòng thời gian chỉ đúng với mô hình này. Tốc độ có xu hướng “phẳng ra” khi dự án của bạn ở tương lai.

 

Bây giờ xét đặc điểm thứ 4, tổng $a_{1}+f_{1}$  của mô hình cho giá trị hạn chế. Điều này là chắc chắn đúng với mặc định 10 điểm dữ liệu tôi đã bao gồm trong bảng tính. Đây là kết quả công thức của mô hình

                                                          $${{f}_{1}}+{{a}_{1}}\left( 1-{{r}^{n-1}} \right)$$

Với $n$ càng lớn, số hạng ${{r}^{n-1}}~$càng nhỏ và cuối cùng sẽ biến mất.

 

Bây giờ, các dữ liệu mặc định tôi sử dụng có hình đường cong logarithm.

 

Dưới đây là những dữ liệu ban đầu và các giá trị xác định bởi các mô hình.

mh2-5.PNG

Dưới đây là đồ thị của dữ liệu gốc (màu xám) và các mô hình ( màu xanh), ngoại suy đến $t~=~30$:

mh2-1.png

Chúng ta có thể nhìn thấy đồ thị tạo ra rất thích hợp, các giá trị dự đoán là hợp lí ứng với hình dạng của dữ liệu gốc.

 

VI. CÁC VẤN ĐỀ

 

Thật không may, bất kỳ dữ liệu có hình dạng khác một cách đáng kể sẽ cho kết quả không thuyết phục.

 

Ví dụ, chúng ta thử dữ liệu này, trong đó có một (xấp xỉ) hàm mũ hình dạng đi xuống.

mh2-6.PNG

Chúng ta có thể nhìn thấy từ bảng rằng các dữ liệu đang có xu hướng tới một giá trị gần 4 và phẳng.

 

Mô hình hiện tại chạy kì lạ, cho chúng tôi đồ thị sau khi ngoại suy đến $t~=~30$.

mh2-2.png

Độ cong là không chính xác (các mô hình là lõm xuống, trong khi dữ liệu gốc là lõm lên) và đồ thị đã không chọn các cân bằng ra khỏi dữ liệu gốc (điều mà các mô hình yêu cầu làm).

 

Ngoài ra, nếu các dữ liệu đại diện cho con số tiêu thụ thì sẽ thật là kỳ lạ để có được các giá trị tiêu cực như thế này!

 

Tôi đã sử dụng tính năng "Add trendline" của Excel và nội suy đến $t~=~30$, đưa ra một mô hình thuyết phục hơn.

mh2-3.png

Một vài điểm cần lưu ý ở đây là tổng các điểm dữ liệu của chúng ta là 55.95. Sử dụng công thức đường chiều hướng trong Excel cho các giá trị hiển thị trên biểu đồ từ 1 đến 10 đượcnhững điều sau đây (Đánh dâu “$E$” trong bảng để đối chiếu với các giá trị ban đầu):

mh2-7.PNG

Tổng giá trị của Excel là 55.43,  rất gần với tổng các giá trị dữ liệu.

 

 

Tôi đã thử với một vài mô hình đồ thị khác, và cũng thu được kết quả sai lệch tương tự.

 

Trong một trường hợp khác, nếu chúng ta nhập vào một dữ liệu tuyến tính, ta có mô hình “thẳng” (mô hình này giúp ta có lý do tin tưởng rằng các giá trị đã dự đoán sẽ tiếp tục theo kiểu tuyến tính):

mh2-4.png

Ta thấy ví dụ trên theo sau điều kiện ràng buộc đã đưa ra, rằng sự tăng trưởng sẽ giảm dần theo thời gian và có xu hướng tiến tới một giá trị cố định nào đó. Tổng của 10 giá trị dữ liệu được đưa ra giống với tổng 10 giá trị đầu của mô hình đầu tiên (trong trường hợp này là 23).

 

Ngoài ra, một số bộ dữ liệu mắc lỗi chia cho số 0.

 

Do vậy, kết luận của tôi là mô hình có vẻ hiệu quả với các dữ liệu có dạng đường cong theo hàm logarithm (Đi lên khi bắt đầu, sau đó dần dần thẳng theo thời gian), nhưng có xu hướng giảm với kiểu dữ liệu khác.

 

Tôi cho rằng bộ dữ liệu của Mike được biểu diễn theo hàm logarithm trong tự nhiên, vì vậy anh ta tìm thấy các mô hình có ích cho công việc của mình.

 

VII. LÝ DO GỐC

 

Thật không may, lý do căn bản ban đầu cho mô hình của Mike bị thất lạc. Anh đã viết:

 

“Làm thế nào để tôi lấy công thức, tất cả các ghi chép của tôi, đoạn ghi nhanh và những thứ khác đã biến mất theo thời gian (lần đầu tiên tôi thực hiện cách đây 20 năm).

 

Các công thức là của tôi, một mình tôi, dựa trên những kiến thức tôi thu được khi còn là một học sinh trung học.”

 

VIII. GHI CHÉP CUỐI CÙNG

 

Cảm ơn vì đã chia sẻ mô hình của bạn, Mike!

 

Điều này có nghĩa là chúng ta vẫn chưa có một giải pháp cho bài toán đặt ra ở phần 1. Có lẽ có một chứng minh cho rằng bài toán đó không thể thực hiện (đối với

bất kỳ dạng dữ liệu). Nhưng tôi nghĩ rằng bàn toán ấy có thể giải được!

 

Nguồn: http://www.intmath.c...l-solution-7517

 

Bài viết do thành viên Chuyên san EXP dịch.


Bài viết đã được chỉnh sửa nội dung bởi hoangtrong2305: 12-11-2015 - 23:45

Toán học là ông vua của mọi ngành khoa học.

Albert Einstein

(1879-1955)

Hình đã gửi


-------------------------------------------------------------------------------------------------------------------


Click xem Đạo hàm, Tích phân ứng dụng được gì?

và khám phá những ứng dụng trong cuộc sống





1 người đang xem chủ đề

0 thành viên, 1 khách, 0 thành viên ẩn danh