Kỳ vọng có điều kiện

Trong bài viết này, chúng ta sẽ làm quen với một vài khái niệm cơ bản trong lý thuyết xác suất mà quan trọng nhất là định nghĩa về kỳ vọng có điều kiện (Conditional Expectation), một trong những  định nghĩa và tính chất quan trọng để xây dựng lý thuyết về Martingale. Lưu ý Martingale (Martingale) và PDE (Partial differential equation) là 2 phương pháp tiếp cận để định giá chứng khoán phái sinh phổ biến nhất.

Đầu tiên, chúng ta sẽ tìm hiểu một số khái niệm trong lý thuyết xác suất liên quan tới không gian xác suất (Probability space), lọc (Filtration), kỳ vọng có điều kiện, kỳ vọng có điều kiện cho bởi \displaystyle \sigma-đại số con,… Để tìm hiểu về các khái niệm này trước hết cần hiểu các khái niệm của hàm số như ánh xạ, ảnh ngược. Trước tiên ta sẽ nhắc lại khái niệm Ánh xạ. Về mặt toán học, ánh xạ là một khái niệm khái quát của khái niệm hàm số. Về mặt ý nghĩa ánh xạ biểu diễn một tương quan (quan hệ) giữa các phần tử của hai tập hợp \displaystyle X\displaystyle Y thoả mãn điều kiện: mỗi phần tử \displaystyle x của tập \displaystyle X đều có một và chỉ một phần tử \displaystyle y \in Y tương ứng với nó. Quan hệ thoả mãn tính chất này cũng được gọi là quan hệ hàm, vì thế khái niệm ánh xạ và hàm là tương đương nhau.

Định nghĩa 1: Ánh xạ \displaystyle f từ một tập hợp \displaystyle X vào một tập hợp \displaystyle Y (ký hiệu \displaystyle f:X \to Y) là một quy tắc cho mỗi phần tử \displaystyle x \in X tương ứng với một phần tử xác định \displaystyle y \in Y, phần tử \displaystyle y được gọi là ảnh của phần tử \displaystyle x, ký hiệu \displaystyle y=f(x).

Tập \displaystyle X được gọi là tập nguồn, tập \displaystyle Y được gọi là tập đích.

\displaystyle \diamond Với mỗi \displaystyle y \in Y, tập con của \displaystyle X gồm các phần tử, có ảnh qua ánh xạ \displaystyle f bằng \displaystyle y, được gọi là tạo ảnh của phần tử \displaystyle y qua \displaystyle f, kí hiệu là \displaystyle f^{-1}(y)

\displaystyle f^{-1}(y)=\{x\in X | f(x)=y \}

\displaystyle \diamond Với mỗi tập con \displaystyle A \subset X, tập con của \displaystyle Y gồm các phần tử là ảnh của \displaystyle x \in A qua ánh xạ \displaystyle f được gọi là ảnh của tập \displaystyle A kí hiệu là \displaystyle f(A)

\displaystyle f(A)= \{y = f(x) , x \in A \}

\displaystyle \diamond Với mỗi tập con \displaystyle B \subset Y, tập con của \displaystyle X gồm các phần tử \displaystyle x có ảnh \displaystyle f(x) \in B được gọi là tạo ảnh của tập \displaystyle B kí hiệu là \displaystyle f^{-1}(B)

\displaystyle f^{-1}(B) = \{x \in X: f(x)\in B\}

Quay trở lại với lý thuyết xác suất, giả sử có một biến ngẫu nhiên \displaystyle X. Chúng ta giả sử có nhiều tình huống khác nhau có thể xảy ra và trong mỗi tình huống thì \displaystyle X sẽ nhận được một giá trị nào đó. Như vậy một biến ngẫu nhiên có thể được mô hình hoá bằng một hàm số \displaystyle X:\Omega\to \mathbb{R}. Ở đây \displaystyle \Omega là không gian đại diện cho các tình huống có thể xảy ra. Điều này hiểu theo ý nghĩa của ánh xạ thì có nghĩa là ứng với mỗi trường hợp trong tập hợp \displaystyle \Omega thì nó sẽ nhận một giá trị nào đó mà giá trị đó là một số thực.

Định nghĩa 2. Cho \displaystyle \Omega là ký hiệu của một tập hợp và \displaystyle \mathcal F ký hiệu một họ các tập con của \displaystyle \Omega. Khi đó \displaystyle \mathcal F là một \displaystyle \sigma-đại số nếu:

1. \displaystyle \varnothing \notin \mathcal F

2. \displaystyle F \in \mathcal F \Rightarrow \Omega / F \in \mathcal F

3. \displaystyle F_1, F_2,... \in \mathcal F\Rightarrow \bigcup_{i=1}^{\infty} F_i \in \mathcal F

Khi đó cặp \displaystyle (\Omega,\mathcal F) là một không gian đo được.

Không gian mẫu \displaystyle \Omega là một tập không rỗng, với các phần tử thường được biết như là các “kết quả” hay “trạng thái tự nhiên” (ví dụ trạng thái sấp hay ngửa của đồng tiền,…) hay nói một cách khác là các tình huống có thể xảy ra. Một trạng thái tự nhiên luôn tồn tại với một xác suất nào đó. Một phần tử của \displaystyle \Omega thường được ký hiệu bởi \displaystyle \omega .

\displaystyle \mathcal F là một tập hợp mà các phần tử của nó được gọi là các biến cố. Các biến cố là các tập con của \displaystyle \Omega. Tập \displaystyle \mathcal F phải thỏa mãn một vài điều kiện, đặc biết nó phải là một \displaystyle \sigma-đại số. Cùng với nhau, \displaystyle \Omega\displaystyle \mathcal F tạo thành một không gian đo được. Một biến cố là một tập hợp các kết quả hay trạng thái tự nhiên mà ta có thể xác định xác suất của nó.

Một cách trực quan hơn ta định nghĩa một không gian xác suất là một bộ ba \displaystyle (\Omega, \mathcal F, P), trong đó:

\displaystyle \Omega là tập không rỗng, hay còn gọi là không gian mẫu, trong đó mỗi thành viên của nó được coi là một kết quả có thể xảy ra của một thực nghiệm ngẫu nhiên. Ví dụ, nếu chọn ngẫu nhiên 100 khách hàng trong các khách hàng của cửa hàng ABC và hỏi họ sẽ chọn loại nước uống nào để sử dụng, thì tập 100 khách hàng đó sẽ là không gian mẫu \displaystyle \Omega.

\displaystyle \mathcal F là một \displaystyle \sigma-đại số của các tập con của \displaystyle \Omega,các khách hàng của nó được gọi là các biến cố. Ví dụ, tập tất cả các chuỗi gồm 100 khách hàng trong đó ít nhất 70 người sẽ chọn Peppsi là sản phẩm họ muốn sử dụng được xem là biến cố rằng ít nhất 70 trong số 100 khách hàng được chọn sẽ lựa chọn Peppsi. Ta nói \displaystyle \mathcal F là một \displaystyle \sigma-đại số có nghĩa rằng, theo định nghĩa, nó chứa \displaystyle \Omega, chứa rỗng, phần bù của một biến cố bất kì là một biến cố, và hợp của một chuỗi (hữu hạn hay vô hạn đếm được) các biến cố bất kì là một biến cố.

\displaystyle P là một độ đo (cụ thể là độ đo xác suất) trên \displaystyle \mathcal F, sao cho \displaystyle P(\Omega)=1. Cần chú ý rằng \displaystyle P là hàm xác định trên \displaystyle \mathcal F chứ không phải trên \displaystyle \Omega.

Một biến ngẫu nhiên \displaystyle X là một measurable function (hàm đo được) trên \displaystyle \Omega. Ví dụ, số khách hàng sẽ lựa chọn Peppsi trong mẫu 100 người là một biến ngẫu nhiên. Nếu \displaystyle X là biến ngẫu nhiên bất kì. Ta kí hiệu \displaystyle P(X \ge 70), hay \displaystyle P(\{ \omega \in \Omega \mid X(\omega) \ge 70 \}), là xác suất của biến cố \displaystyle X \ge 70.

Định nghĩa 3:Cho \displaystyle (\Omega,\mathcal F) kỳ hiệu là một không gian đo được. Một họ các \displaystyle \sigma-đại số \displaystyle \{ \mathcal F_t|t\ge 0\}, tại đó:

\displaystyle \mathcal F_s\subseteq \mathcal F_t \subseteq \mathcal F

Với \displaystyle 0\le s\le t được gọi là một lọc trên \displaystyle (\Omega,\mathcal F)

Một lọc \displaystyle \mathcal F_t là tập hợp của tất cả các biến cố có thể thực hiện được tại \displaystyle t. Sự gia tăng kích cỡ của \displaystyle \mathcal F_t khi thời gian \displaystyle t tăng phản ánh lượng thông tin luỹ tiến theo thời gian, điều đó có nghĩa là lượng thông tin càng tăng nếu thời gian càng dài.

Ở trên chúng ta đã định nghĩa được thế nào là một biến ngẫu nhiên, thế nào là một không gian đo được và thế nào là một lọc cũng như \displaystyle \sigma-đại số con. Phần tiếp theo dưới đây, chúng ta làm quen khái niệm “kỳ vọng có điều kiện của X, theo một tập thông tin đã cho, dưới dạng một \displaystyle \sigma-đại số con \displaystyle \mathcal A của \displaystyle \mathcal F“.

Quay trở lại định nghĩa kỳ vọng có điều kiện của X cho bởi Y: \displaystyle E(X|Y). Chú ý rằng \displaystyle E(X|Y) là một hằng số trên mỗi tập hợp \displaystyle \{Y=y_i\} và giá trị của nó bằng giá trị trung bình của \displaystyle X trên \displaystyle \{Y=y_i\}.

\displaystyle E(X|Y)=\sum_{x}x.P(X=x|Y=y)

Điều đó có nghĩa là:

\displaystyle \diamond Kỳ vọng có điều kiện là một biến ngẫu nhiên.

\displaystyle \diamond Kỳ vọng có điều kiện là một ước lượng giá trị trung bình.

Định nghĩa 4: Cho \displaystyle (\Omega,\mathcal F) kỳ hiệu là một không gian đo được. \displaystyle X:\Omega\to \mathbb{R} là một biến ngẫu nhiên. \displaystyle \mathcal A\subset \mathcal F là một \displaystyle \sigma-đại số con. Cho biến ngẫu nhiên \displaystyle Z:\Omega\to \mathbb{R} thoả mãn các điều kiện sau:

1. \displaystyle Z\displaystyle \mathcal A-đo được: Với \displaystyle a,b\in \mathbb{R}, biến cố của Z được biểu diễn dưới dạng:

\displaystyle \{\omega|a<Z(\omega)<b\}

đã chứa trong \displaystyle \mathcal A (không chỉ đơn thuần là chứa trong \displaystyle \mathcal F).

2. Với mọi \displaystyle A\in \mathcal A khi đó:

\displaystyle E(X.I_A)=E(Z.I_A)

Khi đó ta định nghĩa: \displaystyle Z=E(X|\mathcal A) và gọi đây là kỳ vọng có điều kiện của X theo \displaystyle \mathcal A

(The conditional expectation of X with respect to \displaystyle \mathcal A)

Trong đó ta định nghĩa hàm số \displaystyle I_A là còn có tên gọi là hàm chỉ báo của \displaystyle A (Indicator Function). Hàm chỉ báo \displaystyle I_A của \displaystyle A\displaystyle I_A=1 khi \displaystyle A xảy ra và \displaystyle I_A=0 khi \displaystyle A không xảy ra.

Ta có \displaystyle \mathcal A là một trường \displaystyle \sigma-đại số hay là một \displaystyle \sigma-đại số con, khi đó \displaystyle E(X|\mathcal A) là kỳ vọng có điều kiện của X, cho bởi thông tin chứa trong \displaystyle \mathcal A. Ta vốn dĩ đã có khái niệm \displaystyle E(X|Y), vậy đối với một \displaystyle \sigma-đại số con thì vai trò của nó có gì khác biệt so với việc chỉ xét một biến ngẫu nhiên \displaystyle Y. Câu trả lời là vì một trường \displaystyle \sigma-đại số tương ứng với một lượng thông tin. Ví dụ nếu \displaystyle \mathcal A là một \displaystyle \sigma-đại số sinh bởi \displaystyle Y thì nếu ta biết thông tin về \displaystyle \mathcal A tức là ta cũng sẽ biết thông tin về \displaystyle Y. Ngoài ra \displaystyle E(X|\mathcal A) tương tự như \displaystyle E(X|Y) cũng là một biến ngẫu nhiên. Về định nghĩa sigma đại số sinh bởi biến ngẫu nhiên ta có thể trình bày dưới dạng định nghĩa như sau:

Định nghĩa 5: Giả sử \displaystyle Y:\Omega\to \mathbb{R} là một biến ngẫu nhiên. Ta kỳ hiệu \displaystyle \sigma(Y) là họ tất cả các tập con của \displaystyle \Omega có dạng:

\displaystyle Y^{-1}(B)=\{\omega \in \Omega: Y(\omega)=B\}

trong đó \displaystyle B là một tập Borel của \displaystyle \mathbb{R} (B\in \mathcal B(R)). Khi đó \displaystyle \sigma(Y) là một sigma đại số trên \displaystyle \Omega và ta gọi sigma đại số sinh bởi biến ngẫu nhiên \displaystyle Y.

Ta quay trở lại định nghĩa 4, và tìm hiểu xem ý nghĩa của mục 4.2 là gì? Kỳ vọng có điều kiện \displaystyle E(X|Y) là một ước lượng trung bình của X trên một tập hợp nào đó, 4.2 là tổng quát của ý nghĩa đó, có nghĩa là \displaystyle E(X|\mathcal A) là một ước lượng trung bình của X trong các tập hợp thông tin của \displaystyle \mathcal A. Một câu hỏi đặt ra là ý nghĩa của \displaystyle E(X.I_A)=E(Z.I_A)? Câu hỏi này xin dành cho đọc giả trả lời. Để trả lời câu hỏi này, hãy chú ý đến 1 số tính chất quan trọng của kỳ vọng có điều kiện được chứng minh dưới đây.

Định lý 1: Cho \displaystyle X,Y là các biến ngẫu nhiên. Chứng minh rằng:

\displaystyle E(E(X|Y))=E(X)

Chứng minh: Ta có thể chứng minh như sau :

\displaystyle E(E(X|Y))=\sum_{y}E(X|Y=y).P(Y=y)

\displaystyle=\sum_{y}\left(\sum_{x}x.P(X=x|Y=y)\right).P(Y=y)

\displaystyle=\sum_{y}\sum_{x}x.\frac{P[(X=x)\cap (Y=y)]}{P(Y=y)}.P(Y=y)

\displaystyle=\sum_{y}\sum_{x}x.P[(X=x)\cap (Y=y)]

\displaystyle=\sum_{y}\sum_{x}x.P(Y=y|X=x).P(X=x)

\displaystyle=\sum_{x}x.P(X=x).\left(\sum_{y}P(Y=y|X=x)\right)

\displaystyle=\sum_{x}x.P(X=x)=E(X)

Điều này luôn đúng do ta có:

\displaystyle\sum_{y}P(Y=y|X=x)=1

Ngoài ra ta có định lý sau:

Định lý 2. Cho \displaystyle X,Y_i là các biến ngẫu nhiên (trong đó \displaystyle i=\bar{i,n},n>1). Chứng minh rằng:

\displaystyle E(E(X|Y_1,Y_2,...Y_n,Y_{n+1},...)|Y_1,...,Y_n)=E(X|Y_1,...,Y_n)

\displaystyle \bigtriangledown

Định lý 3. Cho \displaystyle X,Y là các biến ngẫu nhiên độc lập. Chứng minh rằng:

\displaystyle E(X|Y)=E(X)

Chứng minh: Trước hết nhắc lại bổ đề:

 Bổ đề [Quy tắc nhân của các biến cố độc lập]: Hai biến cố \displaystyle A ,B là các biến ngẫu nhiên độc lập khi và chỉ khi: \displaystyle P(A\cap B)=P(A).P(B)

Quay trở lại bài toán, từ công thức xác suất có điều kiện và bổ đề ta có:

\displaystyle P(X=x|Y=y)=\frac{P[(X=x)\cap (Y=y)]}{P(Y=y)}

\displaystyle =\frac{P(X=x).P(Y=y)}{P(Y=y)}=P(X=x)

Mặt khác lại có:

\displaystyle E(X|Y)=E(X|Y=y)=\sum_{x}x.P(X=x|Y=y)

\displaystyle =\sum_{x}x.P(X=x)=E(X)

\displaystyle \bigtriangledown

Trong một số trường hợp, khi quan sát các giá trị ngẫu nhiên của biến X từ đó chúng ta muốn dự đoán giá trị của biến ngẫu nhiên thứ 2 là Y. Kỳ hiệu \displaystyle \widehat{Y}=g(X) là giá trị dự báo của Y dựa trên X, khi đó nếu giá trị quan sát của biến \displaystyle X\displaystyle x hay \displaystyle X=x thì \displaystyle g(x) là một giá trị dự báo của \displaystyle Y. Chúng ta muốn chọn hàm \displaystyle g sao cho \displaystyle g(X) gần với \displaystyle Y nhất. Dự báo “tốt nhất” của Y theo nghĩa để cho sai số bình phương trung bình \displaystyle MSE\to \min chính là \displaystyle g(X)=g_0(X)=E(Y|X).

Định lý 4. Cho \displaystyle X\displaystyle Y là các biến ngẫu nhiên. Khi đó ta luôn có:

\displaystyle E[\left(Y-g(X)\right)^2]\ge E[\left(Y-E(Y|X)\right)^2]

Đẳng thức xảy ra khi và chỉ khi \displaystyle g(X)=g_0(X)=E(Y|X)

Để chứng minh định lý trên ta sử dụng 2 bổ đề sau:

Bổ đề 1: Chứng minh rằng:

\displaystyle E[\left(Y-g(X)\right)^2]=E[Y^2]-2E[g_0(X).g(X)]+E[g^2(X)]

Thật vậy khai triển biểu thức ta có:

\displaystyle E[\left(Y-g(X)\right)^2]=E[Y^2-2Y.g(X)+g^2(X)]=E[Y^2]-2E[Y.g(X)]+E[g^2(X)]

Như vậy để chứng minh bổ đề 1 thì ta chỉ cần chứng minh điều sau là đủ:

\displaystyle E[Y.g(X)]=E[g_0(X).g(X)]

Sử dụng các tính chất của kỳ vọng có điều kiện:

\displaystyle E[Y.g(X)]=\sum_{x}\sum_{y}Y.g(X).P(X,Y)

\displaystyle =\sum_{x}\sum_{y}Y.g(X).\left[P(X).P(Y|X)\right]=\sum_{x}g(X).P(X).\sum_{y}Y.P(Y|X)

\displaystyle =\sum_{x}P(X).\left(g(X).E[Y|X]\right)=E[g_0(X).g(X)]

Bổ đề 2: Chứng minh rằng:

\displaystyle E[\left(Y-g_0(X)\right)^2]=E[Y^2]-E[g_0^2(X)]

Dễ thấy:

\displaystyle E[\left(Y-g_0(X)\right)^2]=E[Y^2-2Y.g_0(X)+g_0^2(X)]

\displaystyle =E[Y^2]-2E[Y.g_0(X)]+E[g_0^2(X)]

Khi đó ta có:

\displaystyle E[Y.g_0(X)]

\displaystyle =\sum_{x}\sum_{y}Y.g_0(X).P(X,Y) =\sum_{x}\sum_{y}Y.g_0(X).\left[P(X).P(Y|X)\right]

\displaystyle =\sum_{x}g_0(X).P(X).\sum_{y}Y.P(Y|X)=\sum_{x}P(X).\left(g_0(X).E[Y|X]\right)

\displaystyle =\sum_{x}P(X).\left(g_0^2(X)\right)= E[g_0^2(X)]

 Từ đó suy ra:

\displaystyle E[\left(Y-g_0(X)\right)^2]

\displaystyle =E[Y^2]-2E[Y.g_0(X)]+E[g_0^2(X)]

\displaystyle =E[Y^2]-2E[g_0^2(X)]+E[g_0^2(X)]

\displaystyle =E[Y^2]-E[g_0^2(X)]

Quay trở lại định lý 4, dựa vào bổ đề 1 và bổ đề 2 trừ vế theo vế ta có:

\displaystyle E[\left(Y-g(X)\right)^2]-E[\left(Y-g_0(X)\right)^2]

\displaystyle =(E[Y^2]-2E[g_0(X).g(X)]+E[g^2(X)])-(E[Y^2]-E[g_0^2(X)])

\displaystyle =E[g_0^2(X)]-2E[g_0(X).g(X)]+E[g^2(X)]

\displaystyle =E[g_0^2(X)-2g_0(X).g(X)+g^2(X)]

\displaystyle =E\left[(g(X)-g_0(X))^2\right]\ge 0

 Ngoài cách chứng minh trên chúng ta có cách chứng minh quen thuộc sau đây:

Cách giải thứ 2:

\displaystyle E[\left(Y-g(X)\right)^2|X]

\displaystyle =E[\left(Y-E[Y|X]+E[Y|X]-g(X)\right)^2|X]

\displaystyle =E[\left(Y-E[Y|X]\right)^2|X]+E[\left(E[Y|X]-g(X)\right)^2|X]+2E[\left(Y-E[Y|X]).(E[Y|X]-g(X)\right)|X]

Ta xem \displaystyle E[Y|X]-g(X) như là một hằng số do đã biết \displaystyle X. Khi đó dựa theo tính chất \displaystyle E[a.Y|X]=a.E[Y|X] ta có:

\displaystyle E[\left((Y-E[Y|X]).(E[Y|X]-g(X)\right)|X]

\displaystyle \left\{E[Y|X]-g(X)\right\}.E[\left(Y-E[Y|X]\right)|X]

\displaystyle \left\{E[Y|X]-g(X)\right\}.\left(E[Y|X]-E[Y|X]\right)

\displaystyle =0

Từ đó ta có:

\displaystyle E[\left(Y-g(X)\right)^2|X]\ge E[\left(Y-E[Y|X]\right)^2|X]

Suy ra:

\displaystyle E[VT]\ge E[VP]

\displaystyle \Leftrightarrow E[\left(Y-g(X)\right)^2]\ge E[\left(Y-E(Y|X)\right)^2]

Đẳng thức xảy ra khi và chỉ khi \displaystyle g(X)=g_0(X)=E(Y|X)

Posted on Tháng Chín 1, 2012, in Nhập môn Toán Tài Chính, Tài chính định lượng and tagged , , , , , . Bookmark the permalink. 2 phản hồi.

  1. Nguyen Thi Thanh Thao

    ad cho e hoi, o dinh nghia 3, lam sao minh co the chung minh duoc ky vong co dieu kien cua bien ngau nhien la bien ngau nhien duoc? ad co the giai thich dum em cho do k a?

  2. dạ, em chào ad và các anh chị, cho em hỏi tại sao kỳ vọng có điều kiện của biến ngẫu nhiên được cho bởi 1 xích ma đại số lại là 1 biến ngẫu nhiên được không ạ, phần đó giải thích chứng mình như thế nào ạ, em thắc mắc mà k biết, e mmong ad và các anh chị giúp đỡ em, em cảm ơn nhiều ạ.

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

%d bloggers like this: