I. CHUYỆN BÊN LỀ
Độc giả Mike Wilde, 78 tuổi có nói rằng:
“Tôi đã phát triển 3 công thức ngoại suy liên quan vào nhiều năm trước, khi vẫn còn đi làm nhằm giúp tôi dự đoán chi phí trong tương lai. Tôi nghĩ rằng có thể bạn muốn biết.”
Đây là những gì Mike đã làm với mô hình của ông, tôi đã nhấn mạnh những điểm chính.
“Mục tiêu của tôi là xác định một phương pháp thuận lợi cho một chuỗi có tính tương quan, dữ liệu được ghi nhận và xác minh có liên quan đến đặc trung, hoạt động liên tục, không có vấn đề nào thất thường trong khoảng thời gian nhất định (Ví dụ như tăng dân số hay phát sinh các chi phí liên quan đến bộ phận tiếp thị).
Cho những điều kiện ràng buộc sau:
1. Tổng các giá trị đơn của đường cong kết quả sẽ bằng chính xác tổng các giá trị đơn của chuỗi dữ liệu ban đầu.
2. Giả thiết là đường cong này cơ thể được sử dụng lâu dài cho các dự án ở tương lai. (Tất nhiên rằng đường cong này sẽ không xuất hiện giá trị mới khi di chuyển về giá trị cuối cùng trong chuỗi).
3. Tôi cũng tính đến việc xem xét các loại hoạt động có trong đầu không thể tiếp tục mãi và sớm hay muộn phải đạt đến một giai đoạn dù có làm cách mấy vẫn không hơn được gì.
4. Quy trình trên sẽ có một đặc điểm bên trong rằng tổng các giá trị đầu tiên và cuối cùng (${{a}_{1}}$ và ${{f}_{1}}$ trong các công thức kèm theo) sẽ là mức tăng trưởng tối đa theo hướng các đường cong đang tiếp cận, mặc dù các đường cong đó không bao giờ thực sự tiếp cận”
II. VÍ DỤ: EXCEL
Mike đã gửi đến tôi một bản Excel minh họa mô hình dữ liệu của Mike.
Dưới đây là bản tính: Đường cong tăng trưởng lịch sử (tải bản tính tại http://intmstat.com/...pment-curve.xls)
Các dữ liệu giống với dữ liệu tôi sử dụng trong phần 1. Dữ liệu này cung cấp cho bạn một ý tưởng về cách mà mô hình hoạt động. Bạn có thể thay đổi dữ liệu trong bảng tính nếu bạn muốn thử các cách khác.
Trong bản tính bao gồm dự đoán của Excel.
(Trong đồ thị thứ 2 trên bảng tính)
III. CÔNG THỨC
Dưới đây là các công thức được sử dụng để tạo ra các giá trị trong cột $B$ trong bảng tính:
$n=$ số hạng đã cho, chuỗi gốc.
$r=$ tốc độ tăng trưởng tăng dần (hoặc giảm dần) của đường cong được phát triển dưới sự trợ giúp của các công thức hiển thị ở trên, trên cơ sở của các số hạng $n$ đang xét. Tốc độ này là tỷ lệ giữa hai số hạng liên tiếp bất kì chứa trong đường cong tăng dần về 1 và tỉ lệ sai khác giữa số hạng thứ 1 và thứ 2, thứ 2 và thứ 3 của 3 số hạng liên tiếp bất kì chứa trong nó luôn bằng với tỷ lệ tăng (hoặc giảm):
$$r=\frac{n\left( {{f}_{0}}+{{a}_{0}} \right)-S-{{a}_{0}}}{n\left( {{f}_{0}}+{{a}_{0}} \right)-S-{{f}_{0}}}$$
${{a}_{0}}=$ số hạng đầu tiên trong chuỗi gốc;
${{f}_{0}}=$ số hạng cuối hoặc số hạng thứ $n$ trong chuỗi gốc;
${{a}_{1}}=$ số hạng đầu tiên của đường cong khai triển bởi công thức gián tiếp;
$${{a}_{1}}=\frac{s\left( r-1 \right)}{n\left( {{r}^{n-1}}+1 \right)\left( r-1 \right)-{{r}^{n}}+1}$$
${{f}_{1}}=$ số hạng cuối hoặc số hạng thứ $n$ của đường cong khai triển bởi các công thức gián tiếp;
$${{f}_{1}}={{a}_{1}}{{r}^{n-1}}$$
$S=$ tổng toàn phần của $n$ số hạng trong đường cong khai triển bởi công thức gián tiếp phải chính xác bằng tổng $n$ số hạng tương ứng trong chuỗi gốc.
IV. MÔ HÌNH
Các công thức Mike sử dụng nhằm cung cấp các giá trị trong cột $F$ của bảng tính (đường cong màu xanh lá cây) như sau (trong đó số $n$ là số lượng dữ liệu trong cột $D$):
$${{f}_{1}}+{{a}_{1}}\left( 1-{{r}^{n-1}} \right)$$
V. LỜI BÌNH VỀ CÁC MÔ HÌNH
Đâu tiên chúng ta hãy chỉ ra những phần có vẻ làm tốt.
Mô hình của Mike chắc chắn thỏa đặc điểm đầu tiên, đó là tổng các điểm dữ liệu đã cho tương tự như tổng các điểm ban đầu. (Cả hai đều là 64 trong trường hợp cho trước dữ liệu mặc định.)
Xét đặc điểm thứ 3, tốc độ biến thiên trở nên ít hơn theo dòng thời gian chỉ đúng với mô hình này. Tốc độ có xu hướng “phẳng ra” khi dự án của bạn ở tương lai.
Bây giờ xét đặc điểm thứ 4, tổng $a_{1}+f_{1}$ của mô hình cho giá trị hạn chế. Điều này là chắc chắn đúng với mặc định 10 điểm dữ liệu tôi đã bao gồm trong bảng tính. Đây là kết quả công thức của mô hình
$${{f}_{1}}+{{a}_{1}}\left( 1-{{r}^{n-1}} \right)$$
Với $n$ càng lớn, số hạng ${{r}^{n-1}}~$càng nhỏ và cuối cùng sẽ biến mất.
Bây giờ, các dữ liệu mặc định tôi sử dụng có hình đường cong logarithm.
Dưới đây là những dữ liệu ban đầu và các giá trị xác định bởi các mô hình.
Dưới đây là đồ thị của dữ liệu gốc (màu xám) và các mô hình ( màu xanh), ngoại suy đến $t~=~30$:
Chúng ta có thể nhìn thấy đồ thị tạo ra rất thích hợp, các giá trị dự đoán là hợp lí ứng với hình dạng của dữ liệu gốc.
VI. CÁC VẤN ĐỀ
Thật không may, bất kỳ dữ liệu có hình dạng khác một cách đáng kể sẽ cho kết quả không thuyết phục.
Ví dụ, chúng ta thử dữ liệu này, trong đó có một (xấp xỉ) hàm mũ hình dạng đi xuống.
Chúng ta có thể nhìn thấy từ bảng rằng các dữ liệu đang có xu hướng tới một giá trị gần 4 và phẳng.
Mô hình hiện tại chạy kì lạ, cho chúng tôi đồ thị sau khi ngoại suy đến $t~=~30$.
Độ cong là không chính xác (các mô hình là lõm xuống, trong khi dữ liệu gốc là lõm lên) và đồ thị đã không chọn các cân bằng ra khỏi dữ liệu gốc (điều mà các mô hình yêu cầu làm).
Ngoài ra, nếu các dữ liệu đại diện cho con số tiêu thụ thì sẽ thật là kỳ lạ để có được các giá trị tiêu cực như thế này!
Tôi đã sử dụng tính năng "Add trendline" của Excel và nội suy đến $t~=~30$, đưa ra một mô hình thuyết phục hơn.
Một vài điểm cần lưu ý ở đây là tổng các điểm dữ liệu của chúng ta là 55.95. Sử dụng công thức đường chiều hướng trong Excel cho các giá trị hiển thị trên biểu đồ từ 1 đến 10 đượcnhững điều sau đây (Đánh dâu “$E$” trong bảng để đối chiếu với các giá trị ban đầu):
Tổng giá trị của Excel là 55.43, rất gần với tổng các giá trị dữ liệu.
Tôi đã thử với một vài mô hình đồ thị khác, và cũng thu được kết quả sai lệch tương tự.
Trong một trường hợp khác, nếu chúng ta nhập vào một dữ liệu tuyến tính, ta có mô hình “thẳng” (mô hình này giúp ta có lý do tin tưởng rằng các giá trị đã dự đoán sẽ tiếp tục theo kiểu tuyến tính):
Ta thấy ví dụ trên theo sau điều kiện ràng buộc đã đưa ra, rằng sự tăng trưởng sẽ giảm dần theo thời gian và có xu hướng tiến tới một giá trị cố định nào đó. Tổng của 10 giá trị dữ liệu được đưa ra giống với tổng 10 giá trị đầu của mô hình đầu tiên (trong trường hợp này là 23).
Ngoài ra, một số bộ dữ liệu mắc lỗi chia cho số 0.
Do vậy, kết luận của tôi là mô hình có vẻ hiệu quả với các dữ liệu có dạng đường cong theo hàm logarithm (Đi lên khi bắt đầu, sau đó dần dần thẳng theo thời gian), nhưng có xu hướng giảm với kiểu dữ liệu khác.
Tôi cho rằng bộ dữ liệu của Mike được biểu diễn theo hàm logarithm trong tự nhiên, vì vậy anh ta tìm thấy các mô hình có ích cho công việc của mình.
VII. LÝ DO GỐC
Thật không may, lý do căn bản ban đầu cho mô hình của Mike bị thất lạc. Anh đã viết:
“Làm thế nào để tôi lấy công thức, tất cả các ghi chép của tôi, đoạn ghi nhanh và những thứ khác đã biến mất theo thời gian (lần đầu tiên tôi thực hiện cách đây 20 năm).
Các công thức là của tôi, một mình tôi, dựa trên những kiến thức tôi thu được khi còn là một học sinh trung học.”
VIII. GHI CHÉP CUỐI CÙNG
Cảm ơn vì đã chia sẻ mô hình của bạn, Mike!
Điều này có nghĩa là chúng ta vẫn chưa có một giải pháp cho bài toán đặt ra ở phần 1. Có lẽ có một chứng minh cho rằng bài toán đó không thể thực hiện (đối với
bất kỳ dạng dữ liệu). Nhưng tôi nghĩ rằng bàn toán ấy có thể giải được!
Nguồn: http://www.intmath.c...l-solution-7517
Bài viết do thành viên Chuyên san EXP dịch.
Bài viết đã được chỉnh sửa nội dung bởi hoangtrong2305: 12-11-2015 - 23:45