Đến nội dung


Chú ý

Diễn đàn vừa được bảo trì và nâng cấp nên có thể sẽ hoạt động không ổn định. Các bạn vui lòng thông báo lỗi cho BQT tại chủ đề này.


hoangtrong2305

Đăng ký: 26-02-2011
Offline Đăng nhập: 23-02-2017 - 18:02
****-

Chủ đề của tôi gửi

Phương trình đại số một ẩn số

16-02-2017 - 19:08

PHƯƠNG TRÌNH ĐẠI SỐ MỘT ẨN SỐ

 

Từ thế kỷ 20 trước Công nguyên, người dân thành Babylon đã biết giải phương trình bậc hai. Nhưng phải đến thế kỷ 16 sau Công nguyên, các nhà toán học của thời Phục hưng: Tartaglia, Cardano, Ferrari, mới tìm ra lời giải cho phương trình bậc ba và bậc bốn. Đầu thế kỷ 19, Abel và Galois, hai thiên tài toán học bạc mệnh, chứng minh nghiệm của phương trình đại số tổng quát bậc từ năm trở đi, không thể biểu diễn được như một biểu thức đại số với căn thức như trong trường hợp đa thức bậc không quá bốn. Công trình của Galois, viết ra như lời trăng trối trước giờ đấu súng, sau đó được xem như mốc khai sinh của Đại số hiện đại.

 

Lý thuyết Galois hiện đại được phát biểu trên cơ sở các khái niệm mở rộng trường và nhóm Galois. Những khái niệm này không dễ nắm bắt. Mục đích của bài viết này là giúp những người mới học nắm bắt những khái niệm đó, thông qua việc tìm hiểu mô thức mà chúng xuất hiện trong quá trình tìm nghiệm của những phương trình đại số cụ thể.

Người viết cho rằng hầu hết khái niệm tưởng như trừu tượng đều có cội nguồn ở những thao tác toán học cụ thể và thông dụng. Người viết cũng cho rằng chỉ khi được nâng lên tầm khái niệm, các thao tác toán học mới trở thành những công cụ tư duy thật sự mạnh mẽ. Câu chuyện sắp kể về ý thuyết Galois có thể xem như một minh chứng. Để hiểu bài viết này, người đọc cần một số kiến thức cơ bản về đại số tuyến tính, trong đó đặc biệt quan trọng là khái niệm chiều của không gian vector.

 

1. Lịch sử của bài toán

 

Vào thế kỷ thứ bảy trước công nguyên, lời giải cho phương trình bậc hai tổng quát

$$\begin{equation} x^2+ax+b=0 \end{equation}$$
đã được nhà toán học Brahmagupta, người Ấn độ, trình bày một cách tường minh ở dạng
$$\begin{equation} x=\frac{-a\pm \sqrt{d}}{2} \end{equation}$$
với $d=a^2-4b$ là biệt thức của phương trình bậc hai.
 
Trước đó, từ khoảng thế kỷ 20 trước công nguyên, người Babylon đã tìm lời giải hình học cho bài toán tương đương tìm hai cạnh của hình chữ nhật biết trước chu vi và diện tích của nó. Dấu vết của những phương pháp hình học khác nhau để giải phương trình bậc hai đã được phát hiện trong hầu hết các nền văn minh cổ đại từ Babylon, Ai cập, Hy lạp, Ấn độ, Trung Hoa ...

 

Phương trình bậc ba tổng quát cũng được người Babylon nghiên cứu. Người Hy lạp cổ đại đã thử xây dựng nghiệm phương trình bậc ba bằng thước kẻ và compa nhưng không thành công. Nhà toán học Trung Hoa Wang Xiaotong đưa ra lời giải cho 27 phương trình bậc ba khác nhau, nhưng không đưa ra phương pháp để giải phương trình bậc ba tổng quát. Đáng kể nhất là phát hiện của nhà thơ người Ba tư Omar Khayyam sống vào thế mười một. Ông chứng minh rằng nghiệm có thể xây dựng nghiệm phương trình bậc ba bằng cách lấy giao hai đường conic. Ngoài ra, ông phát biểu rằng không thể xây dựng nghiệm phương trình bậc ba chỉ bằng thước kẻ và compa. Omar Khayyam không đưa ra một công thức cho nghiệm của phương trình bậc ba giống như công thức (2) cho phương trình bậc hai.
 

Phải chờ đến thời kỳ phục hưng, nhà toán học Tartaglia, sống ở Ý vào thế kỷ thứ mười sáu, mới đưa ra công thức tổng quát đầu tiên cho nghiệm của phương tình bậc ba

$$\begin{equation} ax^3+bx^2+cx+d=0 \end{equation}$$

ở dạng

$$\begin{equation} x=-\frac{1}{3a}\left(b+C+\frac{\Delta_0}{C} \right ) \end{equation}$$
trong đó
$$\begin{equation} C=\sqrt[3]{\frac{\Delta_1+\sqrt{\Delta_1^2-4\Delta_0^3}}{2}} \end{equation}$$

với $\Delta_0, \Delta_1$ là các đa thức tường minh với biến số $a, b, c, d$. Lời giải cho phương trình bậc ba quả là rắc rối, nhưng lời giải cho phương trình bậc bốn của Ferrari còn rắc rối hơn nhiều.

 

Nhà toán học Joseph Lagrange, người Ý, là người đưa ra một phương pháp chung để giải cả phương trình bậc ba và bậc bốn. Phương pháp của Lagrange dưạ trên khái niệm giải thức mà chúng ta sẽ xem xét kỹ lưỡng. Ruffini đã nghiên cứu phương pháp của Lagrange và nhận thấy rằng nó không thể mở rộng ra cho phương trình có bậc năm và bậc cao hơn nữa.
 

Abel là người đầu tiên đưa ra chứng minh chặt chẽ và khẳng định phương trình bậc năm tổng quát không thể giải được bằng căn thức. Định lý Abel-Ruffini cũng được Galois, một nhà toán học người Pháp, chứng minh một cách độc lập. Nhưng ông đi xa hơn Abel và đưa ra một khái niệm có tính chất cách mạng, đó là nhóm Galois.

2. Về phát biểu của bài toán

Bài toán ta quan tâm chính là việc biểu diễn nghiệm của phương trình đa thức

$$\begin{equation} a_0x^n+a_1x^{n-1}+...=0 \end{equation}$$

dưới dạng một biểu thức với biến số $a_0, a_1, ...$ mà trong đó ta được quyền dùng bốn phép toán thông thường và căn thức.

Để hiểu rõ thế nào là biểu diễn được dưới dạng một biểu thức như thế, ta sẽ cần khái niệm trường và mở rộng trường. Ví dụ như các biểu thức với biến số $a_0, a_1, ... a_n$ mà chỉ dùng bốn phép toán thông thường và với hệ số hữu tỉ, là trường sinh ra bởi $a_0, a_1, ..., a_n$. Câu hỏi biểu diễn nghiệm bằng căn thức thực ra vẫn không chuẩn. Thật vậy phương trình bậc $n$ có thể có tới $n$ nghiệm cho nên để hết mập mờ cần làm rõ ta muốn biểu diễn nghiệm nào trong số $n$ nghiệm đó. Dĩ nhiên trong công thức (2), dấu $\pm$ cho phép ta biểu diễn cả nghiệm của (1). Trong khi đó, công thức của Tartaglia (5) dường như cho ta sáu nghiệm khác nhau  của phương trình bậc ba, cái rõ ràng là không thể.

 

Thực ra ta không có cách nào để chọn một trong $n$ nghiệm của phương trình (6). Khái niệm nhóm Galois sinh ta chính là để lượng hoá sự mập mờ này. Ngược lại, như ta sẽ phân tích, cấu trúc của nhóm Galois sẽ quyết định việc phương trình (6) có thể giải được bằng căn thức hay không.

 

3. Mở rộng bậc hai

 

Để giải phương trình bậc hai (1), ta thực hiện phép đổi biến $y=x+\frac{a}{2}$ . Sau khi đổi biến, phương trình (1) để quy về dạng đơn giản hơn

$$\begin{equation} y^2-d=0 \end{equation}$$

Ta có thể coi đây là một cái mẹo để quy phương trình bậc hai tổng quát (1) về phương trình bậc hai rút gọn (7). Ta cũng có thể thay đổi quan điểm: Không quan tâm đến việc tìm ra dạng chính xác (2) của nghiệm nữa, mà chỉ quan tâm đến việc nghiệm có thể biểu diễn dưới dạng biểu thức đại số của $\sqrt{d}$. Lập luận có thể sẽ phức tạp hơn, nhưng sẽ mở ra cho ta một tầm nhìn mới.

Để làm đơn giản vấn đề, giả sử các hệ số $a, b$ là số hữu tỉ. Ta biết rằng trong $\mathbb{C}$, phương trình (1) có hai nghiệm. Ta sẽ ký hiệu $\alpha_1 \in \mathbb{C}$ là một trong hai nghiệm của nó. Giả sử $\alpha_1 \notin \mathbb{C}$, khi đó tập các số phức có dạng

$$L=\{m+n\alpha_1|m,n \in \mathbb{Q}\}$$

là một không gian vector hai chiều trên $\mathbb{Q}$. Từ đẳng thức

$$\alpha_1^2 = -(a\alpha_1+b)$$

ta suy ra rằng nếu $u, v \in L$ thì $uv\in L$. Ta cũng có thể chứng minh rằng nếu $u\in L\setminus \{0\}$ thì $u^{-1} \in L$. Như vậy $L$ là một trường con của $\mathbb{C}$. Nếu xem như không gian vector trên $\mathbb{Q}$, nó có chiều bằng 2. Vì thế ta nói rằng $L$ là một mở rộng bậc hai của $\mathbb{Q}$Ta để ý thấy nghiệm còn lại, ký hiệu là $\alpha_2$, của đa thức

$$P=x^2+ax+b$$

cũng nằm trong $L$. Thật vậy, đa thức bậc hai $P$ đã có một nghiệm \alpha_1\in L$, nghiệm còn lại $\alpha_2$ cũng phải nằm trong $L$ và cũng không là số hữu tỉ. Nói cách khác, mở rộng bậc hai sinh bởi $\alpha_1$, trùng với mở rộng bậc hai sinh bởi $\alpha_2$

$$\{m+n\alpha_2|m, n \in \mathbb{Q}\}$$

Suy từ (2) ra thì cả mở rộng bậc hai sinh bởi $\alpha_1$ hay $\alpha_2$ đều trùng với mở rộng bậc hai sinh bởi căn bậc hai của biệt thức

$$\begin{equation} \mathbb{Q}[\sqrt{d}]=\{m+n\sqrt{d}|m, n \in \mathbb{Q}\} \end{equation}$$

Đây cũng là một cách để diễn đạt việc cả $\alpha_1$ và $\alpha_2$ đều có thể viết được dưới dạng có dạng $m+\sqrt{d}$ với $m, n \in \mathbb{Q}$.

 

Định lý 1. Cho $P \in \mathbb{Q}[x]$ là một đa thức bậc hai bất khả quy, $L$ là mở rộng bậc hai của $\mathbb{Q}$ sinh bởi một trong các nghiệm của $P$Khi đó $L =\mathbb{Q}[\sqrt{d}]$ với $d=a^2-4b$

 

Dễ thấy rằng, nếu $L$ là mở rộng bậc hai của $\mathbb{Q}$ , khi đó mỗi phần tử $\alpha \in L - \mathbb{Q}$ là nghiệm của một phương trình bất khả quy bậc hai nào đó. Vì thế ta có thể phát biểu lại định lý trên ở dạng cô đọng hơn:

Định lý 2. Mọi mở rộng bậc hai của $\mathbb{Q}$ đều có dạng $L =\mathbb{Q}[\sqrt{d}]$ với $d$ là một số hữu tỉ nào đó.
 

Mở rộng ra phương trình bậc cao hơn, ta có thể định nghĩa rành rọt khái niệm phương trình giải được bằng căn thức.

4. Phương trình giải được bằng căn thức

Từ nay trở đi, ta sẽ thay trường các số hữu tỉ bởi một trường $K$ bất kỳ. Thay cho trường các số phức, ta cho trước một trường đóng đại số chứa $K$. Xin nhắc lại rằng trường $\overline{K}$ được gọi là đóng đại số nếu mọi đa thức $P\in \overline{K[x]}$ bậc $n$ đều có đúng $n$ nghiệm trong $K$, nếu ta đếm cả bội. Ta sẽ chỉ xét tới các mở rộng của $K$ chứa trong $\overline{K}$.

Đa thức bậc $n$

$$P=x^n+a_1x^{n-1}+\cdots+a_n \in K[x]$$

được gọi là bất khả quy nếu nó không thể phân tích được thành tích của hai đa thức có bậc nhỏ hơn. Giả sử $P$ là một đa thức bậc $n$ bất khả quy. Với mỗi nghiệm $\alpha \in \overline{K}$ của $P$, ta đặt

$$\begin{equation} K[\alpha]=\{m_0+m_1\alpha+\cdots+m_{n-1}\alpha^{n-1}|m_0,...,m_{n-1}\in K\} \end{equation}$$

Sử dụng đẳng thức  $\alpha^n=-\left(a_1\alpha^{n-1}+\cdots+a_n \right )$, ta chứng minh được rằng nếu $u,v \in K[\alpha]$ thì $uv \in K[\alpha]$. Ngoài ra, nếu $u \in K[\alpha] - \{0\}$ thì $u^-1 \in K[\alpha]$. Nói cách khác, $K[\alpha]$ là một trường con của $K$. Sử dụng giả thiết $P$ là đa thức bất khả quy, ta chứng minh được rằng $K[\alpha]$, xem như không gian vector trên trường $K$, có chiều bằng $n$. Nói cách khác, $K[\alpha]$ là một mở rộng bậc $n$ của $K$Ta nói nghiệm $\alpha$ có thể biểu diễn được bằng biểu thức đại số với căn thức nếu tồn tại một chuỗi mở rộng trường liên tiếp

$$\begin{equation} K=K_0\subset K_1 \subset K_2 \subset \cdots \subset K_r \end{equation}$$

sao cho với mọi $i \in \{1, 2, ..., r\}, K_i$ là một mở rộng bậc $n_i$ của $K_{i-1}$ có dạng

$$K_i \simeq K_{i-1}[x]/(x^{n_i}-\beta_i)$$

và sao cho $K[\alpha] \in K_r$.

 

Khái niệm mở rộng trường đã cho phép ta phát biểu rành rọt câu hỏi liệu nghiệm $\alpha$ của $P$ có thể biểu diễn dưới dạng tổ hợp đại số và căn thức hay không. Nó còn cho phép ta đặt ra những câu hỏi khác, sâu sắc hơn, về nghiệm của đa thức.

 

5. Phụ thuộc đại số giữa các nghiệm

 

Như ở trên, ta vẫn ký hiệu $P \in K[x]$ là một đa thức bất khả quy bậc $n$, và $\alpha$ là một nghiệm của $P$ trong $\overline{K}$, $K[\alpha]$ là mở rộng bậc $n$ của $K$ bao gồm các tổ hợp đại số của $\alpha$ như (9). Khác với trường hợp bậc 2, khi $n \geq 3$, nếu $\alpha_1$ và $\alpha_2$ là hai nghiệm khác nhau của $P$, các trường con $K[\alpha_1]$ và $K[\alpha_2]$ của $\overline{K}$, có thể là khác nhau, như ta thấy trong ví dụ sau đây.

Xét trường hợp $K = \mathbb{Q}$ và đa thức $P = x^3 - 2$. Nếu $\alpha \in \overline{K}$ là một nghiệm của $P$ thì hai nghiệm còn lại sẽ là $j\alpha$ và $j^2 \alpha$. Ở đây ta sử dụng ký hiệu

$$\begin{equation} j = \cos \frac{2\pi}{3} + i\sin \frac{2\pi}{3} \end{equation}$$

là căn bậc ba nguyên sơ của đơn vị. Dễ thấy $\mathbb{Q}[\alpha] \neq mathbb{Q}[j\alpha]$ vì nếu dấu bằng xảy ra thì ta sẽ có $j \in \mathbb{Q}[\alpha]$. Mặt khác, mở rộng $\mathbb{Q}[j]$ là mở rộng bậc 2 của $\mathbb{Q}$ vì $j$ là nghiệm của đa thức bậc hai $x^2 + x + 1$cho nên nó không thể nằm trong một mở rộng bậc ba. Thật vậy, nếu $\mathbb{Q}[j] \subset \mathbb{Q}[\alpha]$ thì $\mathbb{Q}[\alpha]$ sẽ là một không gian vector trên trường $\mathbb{Q}[j]$, cho nên chiều của nó như không gian vector trên $\mathbb{Q}$ phải là một số chẵn. Trong trường hợp này, các mở rộng bậc ba ứng với 3 nghiệm của $P = x^3 - 2$ là đôi một khác nhau:

$$\begin{equation} \mathbb{Q}[\alpha] \neq \mathbb{Q}[j\alpha] \neq \mathbb{Q}[j^2\alpha] \end{equation}$$

Khi $K = \mathbb{Q}[j], \, P = x^3 - 2$ vẫn là đa thức bậc ba bất khả quy trong $K[x]$. Nhưng khi đó các mở rộng bậc ba của $K$ ứng với 3 nghiệm của $P = x^3 - 2$ là trùng nhau:

$$\begin{equation} K[\alpha]=K[j\alpha]=K[j^2\alpha] \end{equation}$$

Ta nhận thấy ở trường hợp đầu, $\alpha$ và $j\alpha$ không phụ thuộc đại số với nhau so với trường cơ sở k = \mathbb{Q}$. Nói cách khác $j\alpha$ không thể biểu diễn được như tổ hợp đại số của $\alpha$ với hệ số hữu tỉ. Tuy vậy, nếu ta mở rộng trường cơ sở thành $K = \mathbb{Q}[j]$, thì $\alpha$ và $j\alpha$ trở nên phụ thuộc đại số.
 

Ví dụ này đưa ta đến với khái niệm trường phân rã của một đa thức bất khả quy. Trường phân rã của một đa thức là công cụ để đo sự phụ thuộc đại số giữa các nghiệm của nó. Trường phân rã sẽ lớn nếu các nghiệm có ít quan hệ đại số, trường phân rã sẽ nhỏ nếu các nghiệm có nhiều quan hệ đại số. Đa thức bất khả quy $P \in K[x]$ bậc $n$ được gọi là tách được nếu nó có $n$ nghiệm đôi một khác nhau trong $K$. Trong trường hợp đặc số không, mọi đa thức bất khả quy đều tách được. Trong trường hợp đặc số $p>0$, có những đa thức bất khả quy nhưng không tách được. Trong bài này, ta sẽ chỉ xét đến những đa thức bất khả quy tách được.
 

Cho $P \in K[x[$ là một đa thức bất khả quy bậc $n$ tách được có hệ số đầu bằng một. Ta ký hiệu $\alpha_1, \alpha_2,...,\alpha_n \in \overline{K}$ là các nghiệm của $P$, và gọi trường phân rã của $K$ là trường con của $\overline{K}$ sinh bởi $\alpha_1, \alpha_2, ..., \alpha_n$. Trong vành đa thức $L[x]$, đa thức $P$ phân rã hoàn toàn

$$P=(x-\alpha_1)...(x-\alpha_n)$$

thành tích các thừa số bậc một.

 

Để làm rõ ý này, ta thực hiện một khảo sát. Ký hiệu $L$ là trường phân rã của $P$, khi đó $L$ là trường con cực tiểu chứa tất cả các trường con $K[\alpha_1], K[\alpha_2], ..., K[\alpha_n]$, còn gọi là compositum của $K[\alpha_1], K[\alpha_2], ..., K[\alpha_n]$. Ký hiệu $L_i$ là compositum của $K[\alpha_1], K[\alpha_2], ..., K[\alpha_n]$, khi đó ta có chuỗi mở rộng trường liên tiếp

$$K = L_0 \subset L_1 \subset \cdots \subset L_n = L$$

 

Ký hiệu $l_i$ là bậc của mở rộng $L_i/L_{i-1}$. Trường phân rã $L$ là mở rộng bậc $l_1, l_2, ..., l_n$ của $K$. Các số nguyên $l_1, l_2, ..., l_n$ phản ánh mức độ phụ thuộc đại số giữa các nghiệm $\alpha_1, \alpha_2, ..., \alpha_n$. Ta có thể khảo sát chúng tuần tự như sau

Vì $P$ là một đa thức bất khả quy bậc $n$ cho nên $L_1$ là mở rộng bậc $l_1 = n$ của $L_0$.

Xét mở rộng tiếp theo $L_2/L_1$. Đa thức $P$ xem như phần tử của $L_1[x]$ không còn bất khả quy nữa, mà có thể phân tích được thành

$$P=(x-\alpha_1)Q$$

Thành phần $Q$ có thể là đa thức bất khả quy, có thể không.

Nếu $Q$ là một đa thức bất khả quy, bậc $n-1$, thì $L_2$ sẽ là một mở rộng bậc $l_2=n-1$ của $L_1$. Trong trường hợp này, $\alpha_1$ và $\alpha_2$ không có quan hệ đại số gì với nhau.

Nếu $Q \in L_1[x]$ không phải đa thức bất khả quy, ta có thể phân tích nó thành $Q = Q_2Q_3$ với $Q_2$ là đa thức bất khả quy có nghiệm là $\alpha_2$. Khi đó $L_2$ là mở rộng của $L_1$ có bậc $l_2$ bằng với bậc của đa thức $Q_2$. Trong trường hợp này $\alpha_1$ và $\alpha_2$ có phụ thuộc đại số.
Tiếp tục với mở rộng $L_3/L_2$ . . . 

 

Qua khảo sát này ta thấy $l_1 > l_2 > \cdots$ là một dãy số nguyên giảm thật sự và từ đó suy ra $l_1 \cdots l_n \leq n!$. Dãy số này đo mức độ phụ thuộc đại số giữa các nghiệm $\alpha_1, \alpha_2, ..., \alpha_n$ của $P$.

 

(còn tiếp)


Hình học và thời gian

15-02-2017 - 00:55

HÌNH HỌC VÀ THỜI GIAN

 

Hình học phẳng và hình học không gian trong chương trình toán phổ thông đều là hình học Euclide. Thêm một chiều thời gian vào hình học chúng ta sẽ có hình học không thời gian hay còn gọi là hình học Minkowski với những nhận thức mới về thế giới xung quanh. Một trong phát hiện quan trọng của hình học không thời gian có ảnh hưởng tới sự phát triển của nhân loại là công thức năng lượng của Einstein. Công nghệ định vị toàn cầu GPS sẽ không thể chính xác nếu không tính đến các quan niệm mới về khoảng cách và thời gian. Hình học không thời gian ra đời khi hình học Euclide không thể giải thích được các quan sát thực nghiệm về vận tốc ánh sáng. Einstein, Lorentz, Poincaré và Minkowski đã tìm ra hình học không thời gian khi đi tìm một mô hình toán học để giải thích thí nghiệm Michelson-Morley. Ứng dụng toán học vào thực tiễn trước tiên là phải chọn mô hình toán học phù hợp và không ràng buộc các quan niệm của chúng ta vào bất cứ lý thuyết toán học nào.

 

1. Nguyên lý cộng vận tốc

Giả sử có một con tàu chạy với vận tốc $v$, trên tàu có một hành khách đi với vận tốc $u'$. Người quan sát trên sân ga sẽ thấy hành khách chuyển động với vận tốc $u$ là bao nhiêu? Bài toán này tuy rất đơn giản đối với học sinh phổ thông, nhưng chúng ta sẽ thử thận trọng kiểm tra từng bước lập luận. Nhiều ý tưởng khoa học vĩ đại cũng đã ra đời khi xem xét các ví dụ đơn giản như vậy. Nếu chúng ta đánh dấu một điểm $X$ bất kỳ trên con tàu, trong một khoảng thời gian $t$, người quan sát trên sân ga sẽ thấy điểm $X$ dịch chuyển một đoạn đường $x=vt$. So với điểm $X$, hành khách sẽ đi được một đoạn đường là $x'=u't$. Trong hình học Euclide, khoảng cách mà hành khách di chuyển so với sân ga là $s = s_1 + s_2 = (v + u')t$. Như vậy vận tốc của hành khách là $u = v + u'$. Đó chính là nguyên lý cộng vận tốc (Hình 1).

 

File gửi kèm  Capture1.PNG   79.79K   5 Số lần tải

Hình 1: Nguyên lý cộng vận tốc.

 

Nguyên lý cộng vận tốc được ứng dụng rộng rãi trong đời sống và tỏ ra khá chính xác với các vận tốc trong đời thường, nhỏ so với vận tốc ánh sáng $c = 300.000 \text{ km/c}$. Toán học đẹp đẽ ở chỗ giúp ta biết trước được các kết quả đo đạc bằng cách sử dụng các công thức toán. Lập luận của nguyên lý cộng vận tốc chỉ dựa trên việc cộng khoảng cách dường như hiển nhiên là đúng. Tuy nhiên, những chân lý được cho là hiển nhiên nhiều lần đã đánh lừa cả những bộ óc vĩ đại nhất. Ví dụ như, năm 1922, Elie Cartan đã đưa ra một lý thuyết tổng quát cho hình học Riemann. Ngay lập tức, ông đã nghĩ tới việc áp dụng lý thuyết này để mở rộng lý thuyết tương đối của Einstein. Do sử dụng một công thức sai mà Cartan cho là đúng "hiển nhiên", ông đã đi đến những hệ quả mâu thuẫn với thực tiễn. Điều đó làm việc ứng dụng lý thuyết Cartan vào thực tế bị chậm lại gần nửa thế kỷ.

 

Chúng ta hãy thử xét thêm một bài toán khác. Giả sử trên tàu chuyển động với vận tốc $v$ có một nguồn sáng. Biết rằng ánh sáng truyền với vận tốc xấp xỉ $c = 300.000 \text{ km/s}$. Nếu áp dụng nguyên lý cộng vận tốc, người quan sát trên sân ga sẽ thấy ánh sáng chuyển động với vận tốc $c+v$ (Hình 2).

 

File gửi kèm  Capture2.PNG   52.98K   4 Số lần tải

Hình 2: Vận tốc ánh sáng không đổi khi nguồn sáng chuyển động.

 

Mặc dù trong lập luận nêu trên, chúng ta chỉ dựa trên nguyên lý cộng vận tốc, nhưng chúng ta sẽ thấy kết luận của nó khác xa với thực tế.

 

2. Thí nghiệm Michelson-Morley

 

Năm 1887, Albert Michelson và Edward Morley đã tiến hành một thí nghiệm cho thấy rằng ánh sáng truyền theo mọi phương với vận tốc không đổi, không phụ thuộc vào vận tốc của nguồn sáng. Theo kết quả thí nghiệm Michelson-Morley, nguyên lý cộng vận tốc không thể áp dụng cho ánh sáng. Cụ thể, trong ví dụ nêu trên, người quan sát đứng trên sân ga sẽ phải thấy vận tốc ánh sáng cũng bằng c giống như hành khách trên tàu. Điều đó có gì mâu thuẫn hay không? Thí nghiệm hay lập luận về nguyên lý cộng vận tốc đã có sai sót? Trong thực tế, thí nghiệm MichelsonMorley đã được lặp lại nhiều lần, loại bỏ mọi sai số và đều dẫn đến kết luận như nhau, không thể lầm lẫn.

 

Chúng ta sẽ còn phải biện luận một khả năng nữa. Thí nghiệm Michelson-Morley được thực hiện trong phòng thí nghiệm đặt trên Trái Đất. Vì thế, nếu Trái Đất đứng yên tuyệt đối như trong thuyết địa tâm của Nhà Thờ Trung cổ, thí nghiệm Michelson-Morley cũng sẽ cho thấy ánh sáng truyền theo mọi phương với vận tốc không đổi. Tuy vậy, chúng ta có những bằng chứng khác để chắc chắn rằng Trái Đất không đứng yên và thực hiện nhiều chuyển động quay khác nhau. Khi một vật bất kỳ chuyển động quay, sẽ có một lực Coriolis tác động lên vật chuyển động trên bề mặt của nó. Trong thực tế người ta đã quan sát được lực này trên hai bán cầu của Trái Đất theo hai hướng khác nhau như trong Hình 3.

 

File gửi kèm  Capture3.PNG   64.17K   5 Số lần tải

Hình 3: Lực Coriolis chứng tỏ Trái Đất không đứng yên.

 

Chúng ta sẽ đi tìm một lời giải thích khác cho thí nghiệm Michelson-Morley.

 

3. Phép biến đổi Lorentz

 

Như vậy, chúng ta cần phải có một công thức cộng vận tốc mới có thể áp dụng được cả cho trường hợp nguồn sáng chuyển động. Công thức mới phải đảm bảo vận tốc ánh sáng đối với người quan sát trên sân ga cũng giống như đối với người quan sát trên tàu và đều bằng $c$ vừa có thể bao gồm cả nguyên lý cộng vận tốc cũ ở một mức độ chính xác nào đó. Để làm được điều này, chúng ta sẽ xét lại các giả thiết "ngầm định" trong lập luận nêu trên về cộng vận tốc. Thậm chí, chúng ta có thể phải thay đổi các quan niệm về khoảng cách, thời gian, hoặc cả hai trong nguyên lý cộng vận tốc mới.

 

Người đầu tiên làm được điều đó vào năm 1892 là nhà vật lý người Hà Lan Henrik Lorentz (giải thưởng Nobel năm 1902). Ông giải thích việc vận tốc ánh sáng không thay đổi khi nguồn sáng chuyển động bằng cách cho rằng thời gian và khoảng cách do người quan sát trên sân ga và trên tàu đo được là khác nhau. Cụ thể người quan sát trên sân ga sẽ đo được khoảng thời gian và quãng đường một đối tượng bất kỳ (kể cả ánh sáng) đi được trong khoảng thời gian lần lượt là $t$và $x$. Trong khi đó người quan sát đứng yên trên tàu sẽ đo được các đại lượng này là $t'$và $x'$. Lorentz đã tìm được liên hệ giữa các đại lượng do hai người quan sát được thông qua phép biến đổi Lorentz sau đây
$$\begin{equation} x'=\beta (-vt+x), \,t'=\beta \left(t-\frac{v}{c^2} x \right ) \end{equation}$$
trong đó $\beta = 1/\sqrt{1-v^2/c^2}$ là hệ số Lorentz. Trước tiên, chúng ta hãy kiểm tra xem phép biến đổi Lorentz có thỏa mãn các yêu cầu đã đề ra hay không.

 

Dễ dàng thử được,công thức biến đổi Lorentz (1) thỏa mãn hệ thức
$$\begin{equation} x^2-c^2t^2=x'^2-c^2t'^2 \end{equation}$$
Hệ thức (2) có ý nghĩa rất quan trọng: Đại lượng $x^2 - c^2t^2$ luôn là một số không đổi không phụ thuộc người quan sát khi họ chuyển động so với nhau.

 

Trong trường hợp số không đổi này bằng 0, đối tượng quan sát sẽ chuyển động với vận tốc ánh sáng đối với cả hai người quan sát bất kỳ
$$\begin{equation} u=x/t=u'=x'/t'=c \end{equation}$$
đây chính là trường hợp nguồn sáng chuyển động không làm thay đổi vận tốc của ánh sáng trong thí nghiệm Michelson-Morley.
Chúng ta hãy tìm công thức cộng vận tốc mới từ công thức biến đổi Lorentz (1) như sau:
$$\begin{equation} x'/t'=\frac{-v+x/t}{1-v/c^2x/t} \end{equation}$$
hoặc một cách tường minh hơn
$$\begin{equation} u'=\frac{-v+u}{1-v/c^2u},\, u=\frac{u'+v}{1+v/c^2u'} \end{equation}$$
Đối với những vật chuyển động với vận tốc nhỏ hơn nhiều so với vận tốc ánh sáng $v/c^2 \approx 0$, chúng ta có nguyên lý cộng vận tốc cũ $u = v + u'$. Như vậy, nếu thời gian và quãng đường do hai người quan sát bất kỳ đo được liên hệ với nhau bởi phép biến đổi Lorentz (1), chúng ta sẽ có nguyên lý cộng vận tốc mới thỏa mãn mọi yêu cầu của thực nghiệm. Điểm cốt lõi nhất trong phép biến đổi Lorentz là thời gian và quãng đường đi được của đối tượng do hai người quan sát là khác nhau. Đặc biệt khái niệm "thời gian địa phương" của người quan sát của Lorentz được nhà toán học Henri Poincaré đánh giá là ý tưởng "tài tình nhất".

 

4. Hệ quy chiếu và bất biến

 

4.1. Biến đổi tọa độ không gian

 

Trong hình học Euclide, chúng ta đã quen thuộc với việc sử dụng phép biến đổi tọa độ không gian. Để đơn giản chúng ta chỉ xem xét không gian hai chiều, tuy mọi tính chất toán học quan trọng mà chúng ta quan tâm sẽ không thay đổi trong không gian nhiều chiều hơn. Một điểm $P$ cho trước được mô tả bằng các tọa độ $(x_1, x_2)$ trong hệ tọa độ thứ nhất và $(x_1', x_2')$ trong hệ tọa độ thứ hai quay đi một góc $\theta$ so với hệ tọa độ thứ nhất như trong Hình 4.

 

File gửi kèm  Capture4.PNG   59.84K   3 Số lần tải

Hình 4: Phép quay không gian bảo toàn khoảng cách

 

Sử dụng kiến thức hình học và lượng giác phổ thông, chúng ta có thể tìm ra công thức biến đổi quay hệ tọa độ như sau
$$\begin{equation} x_1'=\cos \theta x_1+\sin \theta x_2,\, x_2'=\sin \theta x_1-\cos \theta x_2 \end{equation}$$
Hiển nhiên khoảng cách của đoạn OP không thay đổi khi ta quay hệ tọa độ. Do đó
$$\begin{equation} OP^2=x_1^2 + x_2^2 = x_1^{'2} + x_2^{'2} \end{equation}$$
Không những thế, khoảng cách giữa hai điểm bất kỳ $P$ và $Q$ cũng không thay đổi với phép quay hệ tọa độ theo trục bất kỳ trong hình học Euclide.

 

Theo ngôn ngữ của toán học, khoảng cách bất biến với phép quay. Trong không gian Euclide 2 chiều chỉ có một phép quay, trong không gian 3 chiều có 3 phép quay độc lập theo ba trục không gian vuông góc với nhau. Tổng quát, trong không gian $n$ chiều có $n(n-1)/2$ phép quay độc lập. Như vậy, chúng ta sẽ hiểu tại sao trong các giáo trình toán cao cấp, định nghĩa hình học Euclide bao gồm các phép biến đổi quay hệ tọa độ và tính chất bất biến khoảng cách. Trong sách giáo khoa phổ thông, các thuộc tính bất biến được "ngầm định" xem như đúng hiển nhiên, không phát biểu thành tiên đề. Các tính chất bất biến với phép quay này được sử dụng trong các bài toán dựng hình và khi chứng minh các trường hợp bằng nhau của tam giác.

 

Về mặt vật lý, người ta "lý giải" về khả năng ứng dụng hình học Euclide với bất biến khoảng cách là do không gian có tính đồng nhất và đẳng hướng. Nếu trong không gian có một phân bố không đồng đều của các chất, nó sẽ không còn thuần nhất và đẳng hướng nữa. Các hình sẽ bị "méo đi" khi bị dịch chuyển trong các không gian như vậy. Chẳng hạn khi trong không gian có trường hấp dẫn khá mạnh, các đường thẳng sẽ bị uốn cong. Khi đó người ta sẽ phải sử dụng hình học Riemann thay cho hình học Euclide. Như vậy, bất biến khoảng cách không phải là một chân lý hiển nhiên bất di bất dịch. Khoa học không đặt niềm tin mù quáng vào bất cứ chân lý được thừa nhận nào của quá khứ.

 

4.2. Hệ quy chiếu

 

Khi có thêm chiều thời gian trong hình học, chúng ta sẽ có khái niệm hệ quy chiếu, bao gồm các tọa độ không gian và thời gian. Thời gian là một số thực, do đó chúng ta sẽ có 4 biến thực khác nhau. Tuy nhiên, chúng ta sẽ thấy hình học không thời gian có tính chất khác không gian Euclide 4 chiều ở tính bất biến về khoảng cách. Trong hình học không thời gian, bất biến về khoảng cách bị thay thế bất biến khoảng không thời gian được định nghĩa như sau
$$\begin{equation} ds^2=(y_1-x_1)^2+(y_2-x_2)^2+(y_3-x_3)^2-c^2(\tau-t)^2 \end{equation}$$
đối với hai sự kiện xảy ra tại các tọa độ không gian $(x_1, x_2, x_3),\, (y_1, y_2, y_3)$ và tại các thời điểm lần lượt là $t$ và $\tau$.

 

Điều làm khoảng cách có thể thay đổi trong hình học không thời gian không phải là do không gian mất tính đồng nhất và đẳng hướng, mà chính là do các chuyển động với vận tốc lớn. Điều này chúng ta chưa hề biết trong vật lý cổ điển, khi hình học Euclide được coi là duy nhất và hiển nhiên là đúng với thực tiễn. Khoảng cách và thời gian đo được sẽ thay đổi khi người quan sát chuyển động với vận tốc lớn cho phép vận tốc ánh sáng không phụ thuộc vào hệ quy chiếu. Đó chính là ý nghĩa sâu xa của bất biến khoảng không thời gian.

 

Trong không gian ba chiều chúng ta sẽ có 3 phép biến đổi Lorentz độc lập tương tự như trong công thức (1), ứng với 3 tọa độ không gian khác nhau. Như vậy, chúng ta có 3 phép quay tọa độ độc lập trong không gian và 3 phép biến đổi Lorentz độc lập. Poincaré là người đầu tiên nhận ra phép biến đổi Lorentz có tính chất giống như phép quay. Điều khác biệt chỉ là thay các hàm lượng giác thông thường trong công thức (6) bằng các hàm lượng giác hyperbole. Như vậy trong mặt phẳng $(ct, x)$ chúng ta có phép quay hyperbole.
$$\begin{equation} ct'=\cosh \theta ct-\sinh \theta x\, x'=-\sinh \theta ct+\cosh \theta x \end{equation}$$
Chúng ta sẽ tìm hiểu ý nghĩa của các hàm lượng giác hyperbole khi liên hệ với các hàm lượng giác bình thường như sau: Nếu trong công thức Moivre
$$\begin{equation} e^{i\theta}=\cos \theta +i\sin \theta \end{equation}$$
sử dụng biến số thuần ảo $\zeta = -i \theta$ chúng ta sẽ có
$$\begin{equation} e^{\zeta }=\cosh \zeta+\sinh \zeta \end{equation}$$
Do đó,
$$\begin{equation} \cosh \zeta = \frac{e^{x}+e^{-x}}{2},\; \sinh \zeta = \frac{e^{x}-e^{-x}}{2} \end{equation}$$
Hàm lượng giác hyberbole có tính chất sau
$$\begin{equation} \cosh^{2}\zeta -\sinh^{2}\zeta=1 \end{equation}$$
Sử dụng tính chất này chúng ta sẽ kiểm tra được khoảng không thời gian $x_2 - c_2 t_2$ bất biến với các phép quay hyperbole (9). Mặt khác, chúng ta cũng kiểm tra được phép biến đổi Lorentz trong công thức (1) chính là phép quay hyperbole với tham số quay $\theta$ xác định qua vận tốc tương đối giữa hai hệ quy chiếu
$$\begin{equation} \tanh \theta = \frac{\sinh \theta}{\cosh \theta} = \frac{v}{c} \end{equation}$$
Trong vật lý, phép quay Lorentz còn gọi là phép ném do biến đổi một hệ quy chiếu thành một hệ quy chiếu chuyển động với vận tốc $v$ so với nó.

 

5. Không gian Minkowski

 

Năm 1907, nhà toán học Hermann Minkowski, vốn là thày dạy toán của Einstein, nhận thấy tất cả các công thức trong lý thuyết tương đối hẹp do Einstein, Lorentz và Poincaré xây dựng đều có thể viết lại đẹp đẽ trong không gian 4 chiều với 4 tọa độ như sau $(x_1, x_2, x_3, x_0 = ct)$. Khoảng không thời gian bất biến là
$$\begin{equation} ds^2 = dx_1^2+dx_2^2+dx_3^2-dx_0^2 \end{equation}$$
trong đó $dx_\mu, \mu = 1, 2, 3, 0$ là chênh lệch về tọa độ không thời gian giữa hai sự kiện bất kỳ.

 

So với không gian Euclide 4 chiều $\mathbb{R}^4$, hình học không thời gian chỉ có thay đổi một dấu trừ trong định nghĩa khoảng bất biến. Như chúng ta sẽ thấy, khi áp dụng vào thực tiễn, chỉ dấu trừ trong định nghĩa khoảng bất biến này sẽ đảo lộn nhiều nhận thức hàng ngày của chúng ta. Có một cách quan niệm khác: Nếu thời gian là một số ảo, chúng ta sẽ có bất biến như trong hình học Euclide. Nói rộng ra: thời gian cũng là một chiều không gian ảo và ngược lại không gian là chiều thời gian ảo. Như vậy số ảo tồn tại trong thế giới thực. Khiên cưỡng với các số thực mới là phi thực tế. Học Toán là để có một tư duy cởi mở và linh hoạt chứ không phải để tự trói mình vào những kiến thức quen thuộc và lạc hậu.

 

Như vậy, không gian Minkowski đã thống nhất không gian với thời gian, các phép biến đổi Lorentz chính là các phép quay đặc biệt trong không gian 4 chiều này đã "hòa trộn" không gian với thời gian. Các sự kiện vật lý xảy ra trong thực tế đều mô tả bởi một điểm trong không gian Minkowski. Việc thống nhất không thời gian trong hình học Minkowski dẫn tới việc thống nhất rất nhiều đại lượng khác với nhau. Các vector 3 chiều trong hình học không gian đều cần được mở rộng thành các vector 4 chiều trong hình học không thời gian.

 

Trước hết chúng ta hãy xét vector vận tốc $\vec{v} = (v_x, v_y, v_z)$. Thay cho vận tốc, trong vật lý, người ta thường dùng vector xung lượng $\vec{p} = m\vec{v}$. Trong hình học Minkowski, mọi vector đều có 4 thành phần, như vậy chúng ta cần bổ sung thêm một thành phần nữa. Thành phần thứ tư của xung lượng mở rộng chính là một đại lượng quen thuộc trong vật lý là năng lượng. Ta có vector năng xung lượng trong hình học Minkowski định nghĩa như sau:$\vec{p} = (p_1, p_2, p_3, p_0) = (p_x, p_y, p_z, E)$. Việc thống nhất năng lượng với xung lượng vào một vector năng-xung lượng có một ý nghĩa rất sâu xa. Xung lượng là gắn liền với biến thiên theo các hướng không gian. Năng lượng sẽ gắn với biến thiên theo thời gian trong cơ học lượng tử và là nền tảng cho phương trình Schrodinger nổi tiếng mô tả các hiện tượng lượng tử trong thế giới vi mô. Điều đó hàng chục năm sau Minkowski mới được các nhà vật lý hiểu rõ.

 

Một trong những vẻ đẹp nữa của hình học Minkowski là việc mô tả lý thuyết điện từ của Maxwell một cách thống nhất. Như chúng ta biết, lý thuyết điện từ do nhà vật lý người Scottland James Clerk Maxwell phát hiện vào năm 1865. Lý thuyết này bao gồm tất cả các định luật về điện và từ. Lý thuyết này tiên đoán được sự tồn tại của sóng điện từ có ứng dụng thực tế rất rộng rãi ngày nay. Ánh sáng cũng là một loại sóng điện từ đặc biệt. Trong lý thuyết Maxwell có hai đại lượng cơ bản là từ trường $\vec{B} = (B_x, B_y, B_z)$ và điện trường $\vec{E} = (E_x, E_y, E_z)$. Câu hỏi đặt ra là làm thế nào mô tả điện trường và từ trường trong hình học Minkowski, khi các vector trong hình học này phải có 4 chiều?

 

Khác với trường hợp của năng-xung lượng, mô tả của điện trường và từ trường không đơn giản là thêm vào thành phần thứ 4. Trong thực tế, không có đại lượng vật lý nào ứng với thành phần thứ tư của điện trường hoặc từ trường cả. Người ta đã tìm ra một vector 4 chiều trong hình học Minkowski $\vec{A} = (A_1, A_2, A_3, A_0)$ gọi là vector thế năng điện từ. Khi đó điện trường và từ trường có thể biểu diễn qua vector thế năng điện từ như sau
$$\begin{align} \begin{split} \vec{E}&=\left(F_{01},F_{02},F_{03} \right ), \, \vec{B}=\left(F_{12},F_{23}, F_{31} \right )\\ F_{\mu \nu} &= -F_{\nu \mu}=\partial_{\mu} A_{\nu} - \partial_{\nu}A_{\mu} \end{split} \end{align}$$
trong đó $\mu, \nu = 1, 2, 3, 0$ và $\partial_{\mu}$ là đạo hàm theo biến thứ $\mu$. Các phương trình Maxwell, vốn rất khó nhớ bây giờ có thể viết thành dạng đơn giản và đẹp đẽ tương tự như phương trình sóng đối với thế năng điện tử $A_\mu$ như sau
$$\begin{equation} \left(\frac{\partial^2}{\partial x^2}+\frac{\partial^2}{\partial y^2}+\frac{\partial^2}{\partial z^2} - \frac{1}{c^2} \frac{\partial^2}{\partial t^2}\right )A_{\mu}=0 \end{equation}$$
Điều đáng nói là trong hình học Minkowski, điện trường và từ trường được thống nhất với nhau thông qua một vector thế năng điện từ trường 4 chiều.

 

Ban đầu Einstein nghĩ rằng hình học Minkowski chỉ là một công cụ để mô tả các công thức toán học cho đẹp đẽ hơn. Nhưng ông đã nhanh chóng nhận ra ý nghĩa của hình học này trong việc thống nhất các đại lượng vật lý tưởng chừng riêng rẽ với nhau. Từ đó, ông đã có phát minh vĩ đại nhất của nhân loại là lý thuyết tương đối rộng, khi mở rộng hình học Minkowski cho các không gian không có tính đồng nhất. Năm 1915, Einstein công bố lý thuyết tương đối rộng với các công thức toán học sử dụng các vector 4 chiều rất rộng rãi. Khi đó, Minkowski đã qua đời được 6 năm, không kịp chứng kiến sự ra đời của công trình khoa học vĩ đại nhất của nhân loại do học trò của mình khám phá.

 

Ngày nay cách mô tả các đại lượng vật lý thông qua các vector 4 chiều của Minkowski trở nên phổ biến rộng rãi trong vật lý. Nhờ đó, Dirac đã tìm ra phương trình mô tả electron và positron và các hạt vật chất. Cũng nhờ đó, Yang và Mills phát hiện được phương trình Yang-Mills mô tả các tương tác giữa các vật chất.

 

6. Hình học không thời gian và thực tế

 

6.1. Công thức năng lượng của Einstein

 

Việc thống nhất năng lượng và xung lượng trong không gian Minkowski có một hệ quả vô cùng quan trọng. Tương tự như bất biến khoảng không thời gian, năng xung lượng cũng liên quan tới một đại lượng bất biến là khối lượng thông qua công thức
$$\begin{equation} p^2 = p_1^2 + p_2^2 + p_3^3 - E^2 = -m^2c^4 \end{equation}$$
Chúng ta sẽ không tìm cách dẫn ra công thức này theo cách mà Einstein và các nhà toán học và vật lý đồng thời với ông đã làm. Các cách dẫn này chứa đựng nhiều quan điểm khác nhau, kể cả sai sót, còn đang tranh luận cho tới ngày nay [2].

 

Tuy nhiên, những người quan tâm tới cơ sở toán học chặt chẽ của công thức năng xung lượng (18) có thể thấy khối lượng chính là bất biến Casimir trong lý thuyết biểu diễn nhóm Poincaré của E.P.Wigner [3]. Chính vì thế, khối lượng là đặc trưng. Chúng ta hãy viết lại công thức năng xung lượng trong hệ tọa độ Descartes $(x, y, z)$ dưới dạng
$$\begin{equation} E=\sqrt{m^2c^4 + p_x^2 + p_y^2 + p_z^2} \end{equation}$$
Khi xung lượng bằng 0, chúng ta có công thức năng lượng nổi tiếng của Einstein
$$\begin{equation} E=mc^2 \end{equation}$$
Công thức này có một ý nghĩa vô cùng quan trọng: Do khối lượng của vật chất tương đương với năng lượng, khi khối lượng mất đi sẽ giải phóng ra một năng lượng vô cùng lớn. Đó chính là cơ sở của năng lượng nguyên tử.

 

File gửi kèm  Capture5.PNG   256.97K   6 Số lần tải

Hình 5: Bom nguyên tử tại Hiroshima và Nagasaki

 

Năm 1938, người ta đã phát hiện năng lượng được giải phóng trong rã hạt nhân nguyên tử uran khi bị bắn phá bởi các hạt neutron. Bên cạnh đó, trong các phản ứng tổng hợp các hạt nhân nhẹ thành hạt nhân năng, cũng có một lượng năng lượng lớn gấp bội được giải phóng. Công thức khối lượng là thành tựu vĩ đại đáng lẽ chỉ để giải quyết vấn đề năng lượng cho loài người, nhưng tiếc thay, công thức này bị lạm dụng để làm các loại vũ khí hủy diệt chưa từng thấy trong lịch sử. Đó là vết nhơ trong lịch sử loài người. Điều đó cho thấy, để đi vào ứng dụng thực tế, các nhà khoa học cần có nền tảng đạo đức vững chắc bên cạnh kiến thức khoa học uyên thâm.

 

6.2. Quan niệm mới về thời gian và khoảng cách

 

Trong hình học không thời gian, do các khái niệm không gian và thời gian được hòa trộn, các quan niệm về khoảng cách và thời gian tuyệt đối mà chúng ta thừa nhận như các chân lý hiển nhiên không còn đúng nữa. Trước hết là ở tính đồng thời. Hai sự kiện được gọi là đồng thời nếu xảy ra tại cùng một thời điểm. Do thời gian trong các hệ quy chiếu khác nhau là khác nhau, nên hai sự kiện được coi là đồng thời trong một hệ quy chiếu sẽ không còn là đồng thời trong hệ quy chiếu khác. Điều đó cũng tương tự như có hai sự kiện đồng thời xảy ra tại thành phố Hồ Chí Minh và Hà Nội, nhưng đối với người trên chuyến máy bay từ Hà Nội đi thành phố Hồ Chí Minh hoặc ngược lại thì một sự kiện sẽ xảy ra trước sự kiện kia.

 

Trong Hình 6, có một tia sáng chiếu từ giữa toa tàu đang chuyển động. Người quan sát đứng ở trên tàu sẽ thấy tia sáng chiếu đến đầu tàu và cuối tàu đồng thời. Trong khi đó, người đứng trên sân ga sẽ thấy tia sáng đến cuối tàu sớm hơn do quãng đường ánh sáng phải đi ngắn hơn. Bạn đọc có thể tự nghĩ ra rất nhiều tình huống lý thú khi tính đồng thời bị vi phạm.

 

File gửi kèm  Capture6.PNG   7.59K   5 Số lần tải

Hình 6: Tính đồng thời phụ thuộc vào hệ quy chiếu

 

Do thời gian trong các hệ quy chiếu khác nhau là khác nhau do phép biến đổi Lorentz, không những tính đồng thời bị vi phạm mà thời trôi đi trong hệ quy chiếu này có thể dài hoặc ngắn hơn thời gian trôi đi trong hệ quy chiếu kia. Người ta có một kịch bản giả tưởng về hai anh em sinh đôi, sống trên hai hệ quy chiếu khác nhau, người này sẽ già hơn người kia khi gặp lại. Chính vì thế câu chuyện Từ Thức gặp tiên, khi trở về quê nhà, những người thân đều đã qua đời, vẫn có phần thực tế trong hình học không thời gian. Nếu cõi tiên của Từ Thức ở trong một hệ quy chiếu chuyển động, ông sẽ thấy thời gian ngắn hơn so với hệ quy chiếu gắn với quê hương, nơi có người thân của ông sinh sống.

 

Độ dài cũng thay đổi trong các hệ quy chiếu khác nhau. Người quan sát sẽ thấy vật chuyển động ngắn lại nhờ phép biến đổi Lorentz. Điều đáng chú ý là mặc dù thời gian bị đảo lộn trong hệ quy chiếu, trong hình học không thời gian, tính nhân quả không bị đảo lộn. Nếu một sự kiện $A$ là hệ quả của một sự kiện $B$, trong mọi hệ quy chiếu sự kiện $A$ luôn là hệ quả của sự kiện $B$. Do đó, trong mọi hệ quy chiếu, người quan sát sẽ phải luôn luôn thấy cha sinh trước con.

 

7. Công nghệ GPS và thuyết tương đối

 

Các ví dụ nói trên tuy rất thú vị về mặt triết lý, nhưng đều có vẻ trừu tượng và giả tưởng. Trong phần này, chúng ta hãy xét một ví dụ về ứng dụng hình học không thời gian trong thực tế.

Công nghệ định vị toàn cầu GPS là công nghệ xác định vị trí của các vật chuyển động trên bề mặt Trái Đất nhờ các vệ tinh trong không gian. Từ các vật trên mặt đất, người ta cho phát đi sóng điện từ đến các vệ tinh, vệ tinh sẽ nhận được tín hiệu sóng và qua đó tính được khoảng cách từ vật phát sóng đến vệ tinh. Nếu có nhiều vệ tinh (trong thực tế hệ thống GPS có 24 vệ tinh), từ các khoảng cách khác nhau, người ta sẽ xác định được chính xác vị trí của vật trên mặt đất (Xem Hình 7). Chính trong công nghệ này ảnh hưởng của hình học không thời gian đặc biệt quan trọng [4] Các vệ tinh chuyển động trên quỹ đạo quanh Trái Đất với tốc độ $14.000 \text{ km/giờ}$. Do đó đồng hồ trên các vệ tinh sẽ chạy nhanh hơn các đồng hồ trên Trái Đất chừng 7 micro giây trong một ngày đêm. Do quỹ đạo của các vệ tinh cách mặt đất chừng $20.000 \text{ km}$, lực hấp dẫn trên vệ tinh sẽ nhỏ hơn trên mặt đất 4 lần. Các hiệu ứng hấp dẫn lại làm đồng hồ trên mặt đất chạy nhanh 45 micro giây trong một ngày đêm. Như vậy về tổng số, đồng hồ trên mặt đất sẽ chạy nhanh hơn đồng hồ trên vệ tinh 38 giây trong một ngày.

 

File gửi kèm  Capture7.PNG   103.7K   5 Số lần tải

Hình 7: Công nghệ định vị bằng vệ tinh

 

Để đo được vị trí của vật trên mặt đất bằng công nghệ GPS chính xác tới $15 \text{ m}$, sai số đo thời gian phải dưới 50 nanô giây. Nếu không tính tới các hiệu ứng của thuyết tương đối, mỗi ngày đêm sai số sẽ tích lũy khoảng $10 \text{ km}$, một con số rất lớn làm sai lệch việc đo khoảng cách bằng GPS. Ngày nay, hiệu chỉnh thời gian với hình học không thời gian và hình học Riemann bao gồm hiệu ứng hấp dẫn rất quan trọng trong công nghệ GPS.

 

8. Mở rộng hình học không thời gian

 

Năm 1915, Einstein đã ứng dụng hình học Riemann vào vật lý bằng cách mở rộng hình học không thời gian và bỏ qua điều kiện bất biến khoảng không thời gian. Hình học này đã mô tả sự hình thành vũ trụ và tương tác hấp dẫn từ các khoảng cách xa nhau hàng triệu năm ánh sáng.

Tuy nhiên, đó vẫn chưa phải là giới hạn cuối cùng của sự mở rộng. Ngày nay, hình học Riemann mở rộng thêm các chiều không gian và hơn một chiều thời gian cũng bắt đầu được nghiên cứu. Bên cạnh đó các tính chất hình học như độ cong, độ xoắn và các tính chất topo của không thời gian đang đem lại rất nhiều quan niệm mới mở ra những chân trời ứng dụng mới không những cho khoảng cách lớn giữa các Thiên hà mà cả ở các khoảng cách vô cùng bé, nơi các quan niệm hiện tại của chúng ta về không thời gian sẽ phải thay đổi rất nhiều.

Ứng dụng toán học là tìm và phát triển các mô hình toán học phù hợp với thực tiễn. Thực tiễn không dừng lại với bất kỳ lý thuyết toán học cụ thể nào.

 

9. Tài liệu

 

[1] Nguyễn Ái Việt, Cấu trúc không thời gian: Tập 1.Thuyết tương đối hẹp và đối xứng không thời gian (sắp xuất bản)
[2] E.Hecht, American Journal of Physics, 79 (6) (2011) 591–600
[3] V.Bargmann and E.P.Wigner, Proc. Natl. Acad. Sci. 34 (5) (1948) 211–23.
[4] C.M.Will,Stable clocks and general relativity (1995) arxiv: gr-qc/9504017

 

Nguồn: Nguyễn Ái Việt, "Hình học và thời gian", tạp chí Epsilon, số 12, 2016, https://drive.google...iew?usp=sharing


Bài toán chuyến xe bus

13-02-2017 - 20:41

BÀI TOÁN CHUYẾN XE BUS
1. Mở đầu
 
Xe buýt là một trong những phương tiện giao thông huyết mạch của thành phố, xấp xỉ lên đến 33 nghìn chuyến mỗi ngày. Vì vậy, lập tuyến xe buýt mới và tối ưu tuyến xe buýt cũ là một trong những ưu tiên hàng đầu của thành phố. Mỗi tuyến xe buýt thường được biểu diễn bởi một đoạn thẳng có độ dài cố định và một số trạm xe buýt nằm giữa hai đầu mút. Người dân muốn các trạm nằm sao đó để tối ưu thời gian di chuyển của họ. Vì vậy, đối tượng cần được tối ưu là thời gian di chuyển trung bình của tất cả người dân.
 
2. Mô hình
 
Chúng ta xét mô hình sau:
 
Giả sử có một con đường dài $L \text{ km}$. Dân số được phân bố đều nhau trên suốt con đường này. Chúng ta cần tìm số trạm xe buýt và vị trí tối ưu của chúng để giảm thiểu thời gian di chuyển trung bình mà một hành khách phải bỏ ra, để đi từ một điểm bất kỳ trên đường đến một điểm bất kỳ khác. Để đi từ $P$ đến $Q$, một hành khách phải đi bộ đến trạm xe buýt gần $P$ nhất, sau đó lên xe và dừng lại ở trạm xe buýt gần $Q$ nhất, rồi đi bộ đến $Q$. Nếu có hai trạm xe buýt cách $P$ một khoảng như nhau, hành khách sẽ chọn trạm để giảm thiểu số trạm phải đi (tương tự nếu có hai trạm cách $Q$ một khoảng như nhau). Tốc độ đi bộ là $W \text{ km/h}$, tốc độ của xe buýt là $B \text{ km/h}$, và một chiếc xe buýt phải dành khoảng $S$ giờ để nhận thêm hoặc bỏ ra các hành khách ở mỗi trạm. Chúng ta ký hiệu $T(P, Q)$ là thời gian mà hành khách phải bỏ ra để đi từ $P$ đến $Q$.
 
Chẳng hạn ta xét bản đồ sau với độ dài quãng đường $L = 20 km$:
File gửi kèm  Capture.PNG   19.44K   5 Số lần tải
Có 5 trạm xe buýt và 3 vị trí ngẫu nhiên trên bản đồ, ta tính thời gian di chuyển giữa các vị trí này:
1. Để đi từ $P$ đến $R$, hành khách cần đi $1 \text{ km}$ đến trạm 2, sau đó qua 2 trạm với độ dài $14 \text{ km}$ xuống trạm 4, rồi đi bộ $1 \text{ km}$ đến $R$. Tổng thời gian là:
$$T(P,R)=\frac{1}{W}+\frac{14}{B}+2S+\frac{1}{W}=\frac{2}{W}+\frac{14}{B}+2S$$
2. Tương tự, để đi từ $Q$ đến $R$, ta cần thời gian:
$$T(Q,R)=T(P,R)+\frac{1}{W}=\frac{3}{W}+\frac{14}{B}+2S$$
3. Để đi từ $P$ đến $Q$, hành khách sẽ đi bộ $1 \text{ km}$ đến trạm 2, đi xe buýt $0 \text{ km}$ đến trạm 2 (nghĩa là không làm gì cả), rồi đi bộ $2 \text{ km}$ đến $Q$. Tổng thời gian là:
$$T(P,Q)=\frac{1}{W}+\frac{0}{B}+0S+\frac{2}{W}=\frac{3}{W}$$
(Trường hợp này chỉ dùng để minh họa thuật Toán đi, không có ý nghĩa thực tế.)
Chúng ta thống nhất một vài điều kiện và ký hiệu:
• Luôn có một trạm xe buýt ở 2 đầu mút của đoạn đường.
• Giả sử vị trí của các trạm là $0 = x_{1} < \cdots < x_{n-1} < x_{n} = L$, khi đó ta biểu diễn tuyến xe buýt $A$ qua bộ sắp xếp trạm là $A = (x_{1}, x_{2}, \cdots, x_{n-1}, x_{n})$..
• Tuyến xe buýt $A$ cũng có thể được biểu diễn thông qua bộ $A = (d_{1}, d_{2}, \cdots , d_{n-1}, d_{n})$, với $d_{i} = x_{i} - x_{i-1}$ và $i = 1, 2, . . . , n$.
• Ký hiệu $E (A)$ là thời gian trung bình để đi từ một điểm bất kỳ này đến một điểm bất kỳ khác trên tuyến xe buýt $A$, khi bộ sắp xếp trạm của tuyến này được cố định.
 
3. Câu hỏi
 
Bài toán 1. 
1) Cố định $n$ và bỏ qua thời gian đón và thả hành khách ở mỗi trạm. Chứng minh rằng bộ sắp xếp tối ưu xảy ra khi các trạm xe buýt cách đều nhau. Nghĩa là $E(A)$ đạt giá trị tối thiểu khi $d_{1} = d_{2} = . . . = d_{n-1} = d_{n}$.
 
2) Xét trường hợp $L = 20, W = 5, B = 20, S = 0.05$. Tìm giá trị của $n$ để tối ưu hóa $E(A)$, biết $A$ có $n + 1$ trạm xe buýt cách đều nhau. (Do $S \neq 0$ nên không đảm bảo đây là cách sắp xếp tối ưu nhất với một giá trị n bất kỳ.)
 
Bài toán 2. Mô hình của chúng ta còn nhiều khuyết điểm:
1) Hành khách hoàn toàn có thể đi bộ trực tiếp nếu 2 điểm đi và đến gần nhau.
2) Hành khách thường xuyên đến một số nơi như siêu thị, cơ quan, nhà riêng, .v.v. hơn một số điểm trung gian khác.
3) Dân số phân bố chưa hẳn đã đồng đều trên toàn tuyến.
 
Dựa trên câu 1.1) và 1.2), hãy đưa ra một mô hình có thể giải quyết ba vấn đề trên. Để đơn giản, bạn vẫn có thể giả sử tuyến xe buýt là một đường thẳng.

 

Nguồn: Lê Tạ Đăng Khoa, Bài toán chuyến xe bus, tạp chí Epsilon, số 1, 2015, https://www.facebook...412604425701926


Một chút về lịch sử vec-tơ

11-02-2017 - 20:14

MỘT CHÚT VỀ LỊCH SỬ VEC-TƠ

 

Chương trình Hình học lớp 10 chủ yếu xoay quanh các vec-tơ và phương pháp tọa độ. Trong SGK Hình học 10 có đoạn nói về lịch sử của khái niệm vec-tơ, nhưng đoạn đó có vẻ vừa kỳ bí khó hiểu vừa chưa chính xác về mặt thông tin. Bởi vậy Sputnik viết lại đây về lịch sử các vec-tơ cho các bạn học sinh lớp 10 và tất cả những ai quan tâm. Từ vec-tơ là từ nhập từ tiếng Pháp vào Việt Nam. Tiếng Pháp viết là vecteur, đọc là véc-tơ, tiếng Anh viết là vector và đọc cũng thành véc-tơ. Phần lớn các thứ tiếng phương Tây khác cũng viết và đọc từ này tương tự như vậy. Nó có gốc La-tinh, xuất phát từ động từ vehere (mang đi, đưa đi, cưỡi đi). Nghĩa gốc của từ vector chính là “vật/người chở đi, mang đi, cưỡi đi”. Động từ vehere còn sinh ra một từ quen thuộc khác, là từ vehicle (hay vehicule tiếng Pháp), chính là cỗ xe để chở đi. Với gốc như vậy, từ vector trong mỗi lĩnh vực khác nhau có thể có một nghĩa khác nhau. Chẳng hạn trong sinh vật học, nó được dùng với nghĩa “vật truyền cái gì đó”. Ví dụ như các con muỗi được gọi là vector của bệnh sốt rét (malaria).

 

Trong hình học ngày nay, vec-tơ được hiểu là một đại lượng vừa có hướng vừa có độ lớn. Những đại lượng mà chỉ có độ lớn thôi chứ không có hướng, ví dụ như độ dài, thể tích, khối lượng, v.v., thì được gọi là những đại lượng vô hướng, scalars. Những đại lượng mà có cả hướng lẫn độ lớn, như là vận tốc, gia tốc, lực, từ trường, v.v. thì được biểu diễn bằng các vec-tơ. Để vẽ một vec-tơ, người ta có thể vẽ một đoạn thẳng nối từ một điểm $A$ nào đó đến một điểm $B$ nào đó trên mặt phẳng hay trong không gian. Hướng đi từ $A$ đến $B$ chính là hướng của vec-tơ , và độ lớn (đô dài) của đoạn thẳng $AB$ chính là độ lớn của vec-tơ. Khái niệm đoạn thẳng có hướng (tức là vec-tơ) như vậy được một nhà bác học người Italia tên là Giusto Bellavitis (1803-1880) đề xuất vào giữa thế kỷ 19 (khoảng năm 1846) dưới tên gọi “bipoint” (bộ hai điểm), cùng với nguyên tắc cộng vec-tơ $\overrightarrow{AB} + \overrightarrow{BC} = \overrightarrow{AC}$ và nguyên tắc hai vec-tơ bằng nhau nếu 4 điểm tạo thành hình bình hành mà chúng ta biết đến ngày nay.

 

File gửi kèm  Capture.PNG   9.17K   3 Số lần tải

 

Cách làm của Bellavitis cho phép nghiên cứu các vec-tơ mà không cần dùng đến hệ tọa độ. Trước đó, nhà toán học Bernard Bolzano (1781-1848) đã đề xuất từ năm 1804, rồi nhà toán học August Ferdinand Mobius (1790-1868) phát triển vào năm 1827, một số phép toán là tiền thân của phép tính vec-tơ, với các điểm và các hình mà không cần dùng đến hệ tọa độ. Tuy nhiên, trong nhiều vấn đề, khi có hệ tọa độ (hay như nói theo ngôn ngữ ngày nay, có cơ sở của không gian vec-tơ) thì vẫn tiện hơn. Có thể biểu diễn và tính toán các vec-tơ (và các thứ khác trong hình học) thông qua các tọa độ của chúng. Phương pháp tọa độ, và môn hình học giải tích gắn liền với nó, được Descartes và Fermat đưa ra và nghiên cứu từ nửa đầu thế kỷ 17, và được Newton sử dụng trong công trình của mình. cả ba người này ắt hẳn đều đã làm việc với các vec-tơ, chỉ có điều họ chưa gọi chúng là vec-tơ, vì từ vec-tơ trong toán học về sau mới xuất hiện.

 

Trong số những nhà toán học đầu tiên dùng từ vector/vecteur, có thể kể đến William Hamilton (1731-1803) và Pierre-Simon de Laplace (1749-1827), cho những trường hợp riêng. Hamilton nghiên cứu các số quaternion, tức là các mở rộng của số phức gồm những 4 thành phần, dạng $A + iB +jC +kD$ với $A, B, C, D$ là các số thực (trong khi số phức chỉ có 2 thành phần $A + iB$), và ông ta gọi $iB +jC +kD$ là thành phần vec-tơ của số quaternion. Còn Laplace thì gọi đường thẳng tưởng tượng nối từ tâm mặt trời tới tâm trái đất là “vec-tơ tia nối” (rayon vecteur, vector radius), gọi tắt là vec-tơ, và dùng nó để mô tả định luật Kepler (vec-tơ này quét những miền có diện tích bằng nhau trong những khoảng thời gian bằng nhau). Rất nhiều nhà toán học khác của thế kỷ 19, như là Grassmann, Gibbs, Laguerre, Mourey, v.v. đã đóng góp vào việc phát trển khái niệm vec-tơ trong toán học. Giuseppe Peano (1858-1932) là người đã đưa ra hệ tiên đề cho không gian vec-tơ như chúng ta biết đến ngày nay vào năm 1888. Còn Arthur Cayley (1821-1895) là người đã đưa ra khái niệm ma trận, vừa là mở rộng của khái niệm vec-tơ, vừa là công cụ để tính toán với các vec-tơ.

 

Khi ta cố định một hệ tọa độ trong không gian vec-tơ, thì một vec-tơ được hoàn toàn xác định bởi dãy số có sắp thứ tự các tọa độ của nó. Một dãy có xếp thứ tự các số, ví dụ như $(1,5,2,0,9)$, có thể gọi là một vec-tơ, và đó chính là khái niệm vec-tơ hay dùng trong tin học ngày nay: đối với nhiều ngồn ngữ lập trình thì một vec-tơ chính là một dãy số. Nói đến vec-tơ, không thể không nói đến đại số tuyến tính, tức là bộ môn toán học về các phép biến đổi tuyến tính và giải các hệ phương trình bậc 1 (gọi là phương trình tuyến tính). Nghiệm của hệ phương trình tất nhiên là một bộ các ẩn số, và đó chính là vec-tơ. Việc giải quyết các hệ phương trình tuyến tính (kiểu vừa gà vừa chó bó lại cho tròn ba mươi sáu con một trăm chân chẵn) đã được con người biết đến từ thời trước công nguyên (ít ra là ở Trung Quốc). Ngay từ thời đó người ta dù chưa biết đến từ vec-tơ, nhưng đã biết tính toán với các vec-tơ!

 

Một số tài liệu tham khảo có trên mạng:

https://en.wikipedia...ki/Vector_space

https://en.wikipedia...uclidean_vector

https://www.merriam-...ctionary/vector

 

Nguồn: SPUTNIK NEWSLETTER, Số 2, tháng 2 năm 2017, http://sputnikedu.com/SN2-2017.pdf


Tội phạm và động đất

07-02-2017 - 23:20

TỘI PHẠM VÀ ĐỘNG ĐẤT

 
Nếu bạn đang sống ở Los Angeles có hai điều có thể làm cho bạn đặc biệt lo lắng: động đất và tội phạm. May mắn thay, các nhà toán học đã có thể đưa ra cách để giúp cho bạn an toàn ở cả hai điều trên. Một hệ thống phần mềm có tên là là Predpol đã được nhà toán học George Mohler, nhà nhân chủng học Jeff Brantingham và những người khác phát triển, hiện được sở cảnh sát Los Angeles và ơcác thành phố khác sử dụng làm công cụ pháp lý. Nhân viên cảnh sát trong khu vực sử dụng phần mềm này mỗi ngày. 
 
la.jpg
Los Angeles
 
Predpol là kí hiệu viết tắt của “predictive policing – Chính sách Dự đoán ”. Predpol hoạt động dựa trên tính toán xác suất khả năng tội phạm sẽ thực hiện trong một khu vực cụ thể trong một ngày cụ thể dựa trên các dữ liệu theo thời gian thực từ những ngày trước. Nhân viên cảnh sát đã được cung cấp bản đồ dự báo trước cho biết những nơi có xác suất xuất hiện tội phạm cao, do đó họ có thể đưa ra thêm các cuộc tuần tra và hi vọng có thể ngăn chặn tội ác xảy ra.
 
Vậy làm thế nào để hiểu về tội phạm theo nghĩa toán học? Có một cách đó là đi theo hướng từ dưới lên, sử dụng các quy tắc toán học để mô tả những hành vi của bọn tội phạm riêng biệt và quan sát dạng mẫu mô hình xuất hiện. Nhưng bạn cũng có thể sử dụng cách đi từ tren xuống, quên đi tính riêng biệt và nhìn vào tội phạm ứng với số lần xuất hiện trong thống kê, giống như động đất có xuất hiện một số quy luật. Predpol sử dụng cách tiếp cận thứ 2.
 
I. CÁC BĂNG NHÓM VÀ BẠO LỰC
 
Để dễ hiểu, chúng ta hãy tập trung vào những thứ đang phổ biến rộng rãi ở Los Angeles và cũng như các thành phố lớn khác: đó là băng nhóm tội phạm, các băng nhóm này thường gây ra những trận đánh ác liệt nhằm “tranh giành” lãnh thổ, và nếu ai dám gây hấn với băng nhóm này thì chắc chắn sẽ có trả thù. Sau cùng, hệ quả mà các băng nhóm bạo lực đã tạo ra tương tự như động đất: bạo lực sẽ leo thang, cũng như động đất thì đi kèm với dư chấn.
 
grafitti.jpg
Graffiti tại Los Angeles
 
Có thể mô tả động đất theo nghĩa toán học là một quá trình tự kích thích, là những sự kiện xảy ra theo thời gian dựa trên kết quả của nhiều yếu tố phức tạp nên ta xem động đất là một quá trình ngẫu nhiên. Khi có một trận động đất xảy ra thì trong tương lai gần, khả năng xảy ra những dư chấn sẽ tăng lên. Đó là một phần của quá trình tự kích thích. 
 
Trong toán học có một kỹ thuật có thể giải quyết dãy các sự kiện tự kích thích ấy, gọi là Quy trình Hewkes, quy trình này có thể áp dụng vào các cuộc đối đầu giữa hai băng nhóm. Ý tưởng của quy trình này đó là xem hành vi bạo lực giữa các băng nhóm là một dãy các sự kiện theo thời gian. Ta cần hàm số tốc độ $r\left( t \right)$ biểu diễn khả năng xảy ra hành vi phạm tội tại thời điểm $t$, khả năng này còn tùy thuộc vào những gì đã xảy ra trước đó (vì quá trình này là quá trình tự kích thích). Ta thường xem tốc độ này là số lượng các sự kiện xảy ra trong một khoảng thời gian nhất định, ví dụ như số lượng tội phạm mà ta dự đoán xảy ra trong mỗi ngày. Tuy nhiên, trong trường hợp này, ta xác định độ dài khoảng thời gian là cực kì nhỏ. Vì vậy bạn có thể xem hàm số tốc độ $r\left( t \right)$ là tốc độ tức thời mà ta kì vọng hành vi phạm tội xảy ra tại thời gian $t$.
 
Bây giờ ta biểu diễn hàm số tốc độ thành các tổng. Biểu thức đầu tiên của tổng đó là tốc độ nền của tội phạm, tức là tốc độ các cuộc tấn công vô cớ giữa hai băng nhóm đã xảy ra, bỏ qua lý do trả thù. Các biểu thức còn lại của tổng tương ứng với số lượng các cuộc “hỗn chiến” giữa 2 băng nhóm tăng lên theo tốc độ nền, điều này phản ánh phần tự kích thích (sự trả thù). Các cuộc tấn công riêng biệt xảy ra càng lâu về quá khứ thì càng ít tác động vào hàm số tốc độ theo thời gian $t$.
 
Từ năm 2010, trong một bài báo, một nhóm sinh viên năm cuối của trường đại học Angeles, California, đã từng sử dụng Quy trình Hewkes để mô hình sự cạnh tranh giữa các cặp băng nhóm trong tại huyện Hollenbeck, LA. Trong đó, mặc dù khu vực này chỉ có 15 dặm vuông, nhưng đây là một trong những khu vực hung tợn nhất LA. Hàm số tốc độ họ sử dụng là:
$$r\left( t \right)=b+k\left( w{{e}^{-w\left( t-{{t}_{1}} \right)}}+w{{e}^{-w\left( t-{{t}_{2}} \right)}}+w{{e}^{-w\left( t-{{t}_{3}} \right)}}+\ldots +w{{e}^{-w\left( t-{{t}_{n}} \right)}} \right)$$
Trong đó $b$ là một số dương không đổi dùng để đo tốc độ phạm tội nền giữa hai băng nhóm. Từ ${{t}_{1}}$, ${{t}_{2}}$ đến ${{t}_{n}}$ là những xung đột giữa 2 băng nhóm đã xảy ra trong quá khứ trước thời điểm $t$. Biểu thức $w{{e}^{-w\left( t-{{t}_{i}} \right)}}$ cho thấy mong muốn trả thù ngược lại của những tội phạm. Bạn có thể thấy rằng một cuộc “hỗn chiến” đã xảy ra cách đây càng lâu ($t-{{t}_{i}}$ càng lớn) thì biểu thức $w{{e}^{-w\left( t-{{t}_{i}} \right)}}$ càng nhỏ. Trong biểu thức trên $w$ là số dương không đổi, biểu diễn tốc độ ảnh hưởng của tội ác đang giảm dần, $w$ càng lớn, biểu thức $w{{e}^{-w\left( t-{{t}_{i}} \right)}}$ càng nhỏ. Số $k$ là một nhân tử dương chung phản ánh độ lớn của sự trả thù giữa các cặp băng nhóm. Nếu hai băng nhóm không quá “phiền muộn” về nhau, thì giá trị $k$ sẽ nhỏ, góp phần làm cho toàn bộ khả năng xảy ra thanh toán nhau trong quá khứ cũng nhỏ lại. Tuy nhiên, nếu 2 băng nhóm quyết định thanh toán nhau thì thực sự đó sẽ là một trận quyết liệt, giá trị $k$ sẽ lớn.
 
II. MÔ HÌNH VÀ THỰC TẾ
 
Để sử dụng mô hình này, ta cần phải xác định các giá trị cụ thể cho từng tham số, chẳng hạn như tốc độ nền. Để làm được điều này, các sinh viên phải xem xét dữ liệu thực của tội phạm trên nhiều khu vực do sở cảnh sát Los Angeles cung cấp. Có một phương pháp thống kê được gọi là ước lượng hợp lý cực đại cho phép bạn tìm các giá trị tham số sao cho phù hợp với thực tế nhất. 
 
Một khi bạn có các giá trị tham số, bạn có thể sử dụng hàm số tốc độ để mô phỏng tội phạm giữa hai băng nhóm như một dãy sự kiện theo thời gian. Cơ hội xảy ra tội ác là ngẫu nhiên, nhưng cơ hội đó là không giống nhau với mọi thời gian $t$, dĩ nhiên là cơ hội này được tạo ra bởi hàm số tốc độ. Bằng cách xem xét các dạng mô phỏng của tội phạm rồi so sánh với dữ liệu thực tế, bạn có thể đánh giá rằng xem mô hình có phải đã mô tả đúng hiện thực hay chưa (đã có những phương pháp thống kê chuẩn cho việc so sánh đó). Và một khi bạn hài lòng với mô hình này, bạn có thể sử dụng nó để dự đoán những gì sẽ xảy ra trong thế giới thực, từ đó có thể ngăn ngừa tội ác sẽ xảy ra.
 
handcuffs.jpg
Sử dụng toán học để chống lại tội phạm
 
Đây chỉ là một ví dụ đơn giản về ứng dụng toán học vào phần mềm như Predpol, điều này mang lại cho bạn một cái nhìn sơ nét của ý tưởng tổng quát hơn. Predpol không chỉ được sử dụng để tìm hiểu về xung đột băng đảng mà còn để tìm hiểu thêm về các loại tội phạm khác. Cho đến nay kết quả đạt được rất đáng khích lệ. Năm 2011 sau khi sở cảnh sát Santa Cruz bắt đầu sử dụng Predpol thì những vụ trộn cướp đã giảm 27% so với năm trước và năm 2011-2012, trong một buổi giới thiệu tại Hạt Foothill ở Los Angeles, người ta cho biết tội phạm đã giảm 17% so với 0,4% mức tăng trung bình trên những nơi còn lại ở thành phố. Do đó một số công dân của LA cảm thấy rằng tội phạm phải trả giá, có thể bằng cách sử dụng toán học để đấu tranh chống lại chúng.
 
Bài viết do thành viên Chuyên san EXP dịch