Đến nội dung

Hình ảnh

Truy lùng dấu vết kẻ phản bội


  • Please log in to reply
Chủ đề này có 36 trả lời

#21
RongChoi

RongChoi

    Thượng sĩ

  • Founder
  • 215 Bài viết

Có hai thắc mắc với RC thế này:
- Vẫn xét bài toán là dãy nhị phân như giả thiết ở trên đúng không?
- Kẻ phản bội không nhất thiết phải tìm cách để vu khống cho 1 người vô tội. Mục đích của kẻ phản bội là tạo ra được các CD giả và che lấp dấu vết, nghĩa là nó tìm cách xóa dấu vết để khi nhà sản xuất có được trong tay các CD giả thì vẫn không truy ngược trở lại, hòng tìm ra ai đã phản bội. Nếu trả lời được câu hỏi của RC thì chỉ mới giải quyết được phần "không gây hại cho người cô tội" chứ chưa nói gì về việc tìm tội phạm, điều này cũng đồng nghĩa việc chấp nhận có CD giả trên thị trường??

Anh Badman đọc lại câu hỏi 2 đi chứ, mình đang giải quyết vấn đề a) : "chống đổ tội". Câu hỏi 3 đề cập đến vấn đề này dưới dạng hình thức. Vấn đề "truy lùng dấu vết" tạm thời chưa đề cập tới. Mình đi từng bước nhỏ thôi, hôm qua anh chả trách mọi người chạy nhanh quá còn gì :delta
Nhưng nếu anh có giải pháp truy lùng ngay thì rất tuyệt :leq
Ngoài ra thì mình luôn luôn xét văn bản như chuỗi nhị phân.

#22
madness

madness

    Trung sĩ

  • Thành viên
  • 137 Bài viết
Cách hình thức hóa vấn đề mà anh RongChoi nêu ra hay quá, "điều kiện bảo vệ người vô tội" có thể hiểu như sau: nếu một tập các tội phạm x,y,z.... kết hợp lại để tìm ra những chỗ bị đánh dấu, thì khi chúng tạo ra một dĩa giả, không có ai ngoài chúng có cùng dấu với dấu mà chúng tạo ra trong dĩa giả.

Tuy nhiên, mad xin có một số câu hỏi như sau:

1. Trong việc truy tìm thủ phạm: Nếu A = {x,y} là 2 thủ phạm, kết hợp tạo ra một dấu trong F(A), B = {x,z} là 2 thủ phạm, kết hợp tạo ra một dấu trong F(B), F(A) và F(B) chưa chắc là ko giao nhau, và nếu giao nhau thì chưa chắc điểm giao là x. Như thế thì khi một dĩa giả có dấu t <> x, ta thực hiện hàm ngược F^{-1}(t) thì được 2 trường hợp là {x,y} và {x,z}, như thế sẽ dẫn tới việc bắt sót chăng :delta ? Tức là chỉ bắt được x, mà y hoặc z có thể lọt lưới ? Có thể (hay có cần) đặt thêm điều kiện về điều này không?

2. Độ hiệu quả của code C có thể hiểu theo các nghĩa sau:
a. Thời gian (time complexity): để thực hiện hàm ngược để truy lùng thủ phạm, hay là để tính ra code C ?
b. Độ lớn của code C (số phần tử trong C). Ví dụ như khi đánh 10 dấu, có 1024 từ mã, mà code C1 ta chọn ra có 10 từ mã, code C2 có 100 từ mã, thì code C2 được cho là hiệu quả hơn C1 chăng?

#23
BadMan

BadMan

    Người quản trị

  • Founder
  • 1369 Bài viết

... mình đang giải quyết vấn đề a) : "chống đổ tội".

Hì, giờ mới đọc đến đoạn Code C của RC và thống nhất làm từng bước. Nhưng đi học chút đã, chiều về vào lại :delta
Cơm, áo, gạo, tiền
Bút, nghiên, sách, vở

#24
RongChoi

RongChoi

    Thượng sĩ

  • Founder
  • 215 Bài viết
Cả hai câu hỏi của Madness đều rất thú vị.

Tuy nhiên, mad xin có một số câu hỏi như sau:

1. Trong việc truy tìm thủ phạm: Nếu A = {x,y} là 2 thủ phạm, kết hợp tạo ra một dấu trong F(A), B = {x,z} là 2 thủ phạm, kết hợp tạo ra một dấu trong F(B), F(A) và F(B) chưa chắc là ko giao nhau, và nếu giao nhau thì chưa chắc điểm giao là x.


Điều kiện của việc chống đổ tội là http://dientuvietnam...mimetex.cgi?F(W) :delta http://dientuvietnam...mimetex.cgi?F(A) trong Code chính là A và do đó chắc chắn phần giao nhau là x.

Như thế thì khi một dĩa giả có dấu t <> x, ta thực hiện hàm ngược F^{-1}(t) thì được 2 trường hợp là {x,y} và {x,z}, như thế sẽ dẫn tới việc bắt sót chăng :leq ? Tức là chỉ bắt được x, mà y hoặc z có thể lọt lưới ? Có thể (hay có cần) đặt thêm điều kiện về điều này không?


Việc truy lùng chỉ xét đến bắt 1 tên thôi chứ không hy vọng bắt được tất cả các tên. Trong thực tế bắt được 1 tên có thể dùng các biện pháp "nghiệp vụ" để bắt các tên khác :leq
Việc bắt tất cả các tên đã cấu kết nói chung là không thể. Giả sử có 10 tên cấu kết với nhau nhưng sau khi xem xét, phân tích thông tin nếu bọn chúng chỉ chọn ra 8 bản thực sự có giá trị để tạo ra 1 bản copy mới thì không thể có cách nào bắt được 2 tên tuy có tội nhưng rõ ràng không có dấu vết.

2. Độ hiệu quả của code C có thể hiểu theo các nghĩa sau:
  a. Thời gian (time complexity): để thực hiện hàm ngược để truy lùng thủ phạm, hay là để tính ra code C ?
  b. Độ lớn của code C (số phần tử trong C). Ví dụ như khi đánh 10 dấu, có 1024 từ mã, mà code C1 ta chọn ra có 10 từ mã, code C2 có 100 từ mã, thì code C2 được cho là hiệu quả hơn C1 chăng?

Tất nhiên như vậy thì Code C2 hiệu quả hơn rồi!

Hiệu quả chính là 1 trong các vấn đề cốt lõi. Và quả thực khi đánh giá hiệu quả thì 2 vấn đề quan trọng nhất đúng như madness đề cập : độ dài biểu diễn Code C và thời gian cần thiết để "truy lùng"

#25
RongChoi

RongChoi

    Thượng sĩ

  • Founder
  • 215 Bài viết
Để việc trao đổi được nhanh hơn, RC đưa ra đáp án (tuy không hiệu quả) của việc chống đổ tội :

Giả sử nhà sản xuất muốn bán n đĩa CD, họ sẽ dùng Code C_0(n) có độ dài mỗi từ là n bít. Code C_0(n) sẽ bao gồm n từ mã, mỗi từ mã gồm n-1 bít 0 và duy nhất 1 bít 1 :
Ví dụ cho n = 4 : C= {0001,0010,0100,1000}

Ta thấy ngay rằng code C_0(n) là an toàn trước sự cấu kết của n-1 kẻ phả bội theo nghĩa : n-1 kẻ không thể qui tội cho người thứ n còn lại.

Ta thấy ngay 2 nhược điểm :
1. Đọ dài code lớn. Ta mong muốn sẽ có một Code với độ dài làm một hàm theo log(n) chứ không phải theo n.
2. Sự cấu kết của 2 kẻ sẽ xóa toàn bộ dấu vết.

Như vậy, trước hết ta sẽ đề cập đến vấn đề đầu tiên :


Câu hỏi 4: Giảm độ dài Code C_0(n) để sự cấu kết không qui tội cho người vô can.
Điều kiện giảm nhẹ :
a) ta có thể xét trường hợp số kẻ cấu kết không vượt quá một mức c nào đó
b) việc chống đổ tội mang nghĩa xác suất tức là có thể : sự cấu kết của c kẻ phản bội không thể đổ tội cho người vô can với xác suất sai epsilon.

RC viết thêm 1 bài giới thiệu qua về thuật toán xác suất để nếu có bạn nào chưa nghe tới cũng có thể nắm được vấn đề để tiếp tục thảo luân. Vì đó là vấn đề bên lề nên RC đặt bài viết tại địa chỉ :

http://www.diendanto...t=0

#26
madness

madness

    Trung sĩ

  • Thành viên
  • 137 Bài viết

Điều kiện của việc chống đổ tội là http://dientuvietnam...mimetex.cgi?F(W) :huh: http://dientuvietnam...mimetex.cgi?F(A) trong Code chính là A và do đó chắc chắn phần giao nhau là x.


Topic hay mà ko thấy anh RongChoi tiếp tục nhỉ :huh:

Điều kiện chống đổ tội này, mad nghĩ kĩ lại thì thấy nó có một lỗ hổng, ko biết có đúng ko. Ví dụ như có 2 tập thủ phạm (ko nhất thiết giao nhau) A và B mà F(A) và F(B) có một điểm chung nằm ngoài C, thế thì khi dĩa giả chứa điểm chung ngoài C đó, làm sao có thể biết tập thủ phạm 1 hay tập thủ phạm 2 phạm tội.

Nếu muốn bác bỏ điều này thì phải CM rằng nếu A, B ko giao nhau thì F(A) và F(B) cũng ko giao nhau. Nhưng điều này cũng chưa chắc đúng.

#27
RongChoi

RongChoi

    Thượng sĩ

  • Founder
  • 215 Bài viết

Điều kiện chống đổ tội này, mad nghĩ kĩ lại thì thấy nó có một lỗ hổng, ko biết có đúng ko. Ví dụ như có 2 tập thủ phạm (ko nhất thiết giao nhau) A và B mà F(A) và F(B) có một điểm chung nằm ngoài C, thế thì khi dĩa giả chứa điểm chung ngoài C đó, làm sao có thể biết tập thủ phạm 1 hay tập thủ phạm 2 phạm tội.

Hi madness, điều kiện chống đổ tội đúng đấy chứ? F(A) giao F(B) chứa từ mã X ngoài code C chẳng hạn thì có sao đâu? Vì khi đó X không tương ứng với bản hợp lệ nào cả (mỗi bản hợp lệ tương ứng một từ mã trong code C).

Nếu muốn bác bỏ điều này thì phải CM rằng nếu A, B ko giao nhau thì F(A) và F(B) cũng ko giao nhau. Nhưng điều này cũng chưa chắc đúng.

Hay đấy, đây là điều kiện cần cho việc lập mã C để có thể truy lùng lại dẫu vết kẻ phạm tội. Mọi người nghĩ tiếp thử xem.

#28
madness

madness

    Trung sĩ

  • Thành viên
  • 137 Bài viết

Hi madness, điều kiện chống đổ tội đúng đấy chứ? F(A) giao F(B) chứa từ mã X ngoài code C chẳng hạn thì có sao đâu? Vì khi đó X không tương ứng với bản hợp lệ nào cả (mỗi bản hợp lệ tương ứng một từ mã trong code C).

Ý của mad là trong trường hợp này sẽ ko xác định được thủ phạm. Anh RongChoi cho là điều kiện chống đổ tội đúng mà mad cho là nó sai bởi vì 2 ng` hiểu đìều kiện chống đổ tội theo 2 hướng khác nhau. mad hiểu trong trường hợp này thì tập thủ phạm A (thủ phạm thật sự) có thể đổ thừa là: "Ứ ừ, em ko làm chuyện này, các cô các bác xem lại, tụi B hợp tác có thể tạo dĩa giả như thế này!" :phi


Hay đấy, đây là điều kiện cần cho việc lập mã C để có thể truy lùng lại dẫu vết kẻ phạm tội. Mọi người nghĩ tiếp thử xem.


Cái này có thể tìm phản ví dụ hay CM, nhưng mad đang nằm trên thớt, đợi ng` ta băm thịt xong gùi mới xem típ được :Rightarrow

#29
RongChoi

RongChoi

    Thượng sĩ

  • Founder
  • 215 Bài viết

Ý của mad là trong trường hợp này sẽ ko xác định được thủ phạm. Anh RongChoi cho là điều kiện chống đổ tội đúng mà mad cho là nó sai bởi vì 2 ng` hiểu đìều kiện chống đổ tội theo 2 hướng khác nhau. mad hiểu trong trường hợp này thì tập thủ phạm A (thủ phạm thật sự) có thể đổ thừa là: "Ứ ừ, em ko làm chuyện này, các cô các bác xem lại, tụi B hợp tác có thể tạo dĩa giả như thế này!" :Rightarrow

Vấn đề madness nói cũng là một vấn đề rất thú vị đấy. Đó là "chống chối tội". Tôi đã chỉ ra là anh có tội thì cấm mà có cãi. Nhưng đó thuộc về lĩnh vực "truy lùng" rồi. Chống đổ tội chỉ hiểu theo ý nghĩa thông thường "cả hội xúm vào đổ tội cho 1 người lương thiện", tức là "từ mã mà cả hội hợp lại tạo ra trùng với từ mã của 1 người không dính dáng gì tới hội đấy cả".

Cái phần "truy lùng" có cả 2 mặt đúng như madness dự đoán đấy : phản ví dụ và chứng minh. Sẽ không có cách truy lùng chính xác 100% nhưng có thể có thuật toán xác suất để truy lùng với xác suất (100-epsilon)% với epsilon nhỏ bao nhiêu cũng được. Đấy cũng là lý do anh đưa ra (một cách không chặt chẽ) khái niệm thuật toán xác suất.

#30
nguyen_hung

nguyen_hung

    Đại lãn

  • Thành viên
  • 299 Bài viết
Nếu chúng ta ghi dữ liệu lên một loại CD riêng, đặt hàng từ một hãng sản xuất nào đó thì khi tội phạm copy sẽ không có CD riêng đó để copy. Nếu có trong tay bản CD lậu chúng ta có thể bằng phương pháp khoa học hình sự tìm ra nhà chế tạo đĩa CD lậu đó, cách thức kẻ gian ghi đĩa lậu.

#31
werty98

werty98

    Lính mới

  • Thành viên
  • 5 Bài viết
Mình mới vô diễn đàn hôm nay, thấy nội dung hấp dẫn quá, nhất là thread này lại gãi đúng chỗ ngứa của mình. Mấy tháng nay mình nhức đầu với cái watermarking quá đi.

Xin nêu rõ cho một số bạn mới làm quen với lĩnh vực này. Vấn đề quản lý sở hữu dữ liệu số Digital Right Management (DRM), trong đó có bài toán fingerprinting, theo xu hướng nghiên cứu hiện nay là kết hợp giữa hai kỹ thuật cơ bản: mã hóa (cryptography) và đánh dấu (watermarking).

Cryptography mà với đại diện là các giải thuật mã hóa dùng chìa khóa công khai đã đạt được kết quả cuối cùng sau mấy chục năm nghiên cứu, hiện nay đã được sử dụng rộng rãi. Đặc điểm cơ bản của cryptography là sử dụng cho peer-to-peer communications, người gửi và người nhận sử dụng khoá công khai hoặc bí mật để truyền dữ liệu an toàn (người thứ ba cho dù bắt được dữ liệu mã hóa nhưng không có chìa khoá để mở thì không sử dụng được dữ liệu).

Điểm yếu của cryptography là một khi dữ liệu đã được mở khóa rồi thì nó không còn được bảo vệ nữa. Về nguyên tắc, cryptography dùng cho liên lạc mà cả hai phía truyền nhận "tin tưởng" lẫn nhau. Để khắc phục khiếm khuyết này, người ta nghĩ ra watermarking.

Watermarking được thiết kế để sử dụng cho multi-user communications. Watermark có thể hiểu như là một cái tem "trong suốt" được dán lên trên dữ liệu. Sự "trong suốt" này nhằm mục đích làm cho dữ liệu đánh dấu vẫn có giá trị sử dụng cho người đang "cầm" nó. Về lý thuyết, nếu cái tem này không bị phá huỷ hoặc thay thế thì dữ liệu coi như được bảo vệ (cho dù có bị sao chép qua nhiều hình thức). Đặc điểm này khá phù hợp với quan điểm của bảo vệ bản quyền: một tác phẩm được nhiều người sử dụng nhưng chỉ có một (hoặc một số ít) người nắm quyền sở hữu nó.

THế giới nghiên cứu watermarking suốt mười năm nay vẫn chưa đạt được một thành tựu nào đáng kể. Khó khăn lớn nhất là chống lại attacks. Attacks chính là những tác động khác từ bên ngoài làm cho watermark gắn trên dữ liệu bị phá huỷ, hoặc làm cho người ta không nhận dạng ra nó, hoặc thay thế nó bằng một watermark khác. Attacks này được giới hạn là nó cũng phải không làm mất đi giá trị sử dụng của tài liệu.

Trong quá trình nghiên cứu watermarking, mình cảm nhận được hai mâu thuẫn sau của lý thuyết watermarking:
1- Việc đánh dấu watermark lên dữ liệu và việc attack để phá watermark đều không được làm mất đi giá trị sử dụng của dữ liệu (VD như không được làm suy giảm nhiều chất lượng của một bộ phim chẳng hạn). Tuy nhiên giá trị sử dụng của dữ liệu lại là một khái niệm hết sức mơ hồ, được đo đạc và so sánh hơi tuỳ tiện.

2- Mình đang làm watermarking on compressed data nên thấy thêm một câu chuyện "quả trứng và con gà" như thế này: trong khi watermarking cố gắng sử dụng các thông tin dư thừa của dữ liệu (VD như khoảng cách giữa các ký tự như có bạn đã trình bày ở trên) để gắn watermark vào nhằm không thay đổi giá trị sử dụng của dữ liệu thì việc nén dữ liệu lại cố gắng làm mất đi các thông tin dư thừa. Như vậy, nếu có một giải thuật nén tối ưu thì watermarking coi như đi đứt.

#32
werty98

werty98

    Lính mới

  • Thành viên
  • 5 Bài viết
Trở lại bài toán cái đĩa CD do RongChoi đề ra. Theo như mình đã trình bày ở trên, cái mơ hồ trong bài toán này chính là chưa chỉ rõ ra cái "vô cùng giá trị" của cái CD nó nằm ở chỗ nào? Bài toán trở nên phức tạp ra rất nhiều khi đặt vấn đề người ta copy một ít dữ liệu trong cái đĩa CD đó thôi, giả sử cắt rời bộ phim thành nhiều scene chẳng hạn. Một nửa cái bánh tráng vẫn là bánh tráng, nhưng một nửa con bò lại là thịt bò, :-p . Cái này coi bộ hơi nhức đầu à nha.

Bởi vậy, mình vẫn nghĩ là giải pháp "tin tưởng lẫn nhau" như hiện nay người ta vẫn áp dụng với cryptocraphy xem ra còn khả thi hơn là dùng watermarking cho fingerprinting. Cái này phụ thuộc vào ý thức tôn trọng pháp luật, hi hi. Ta không vi phạm pháp luật bởi vì ta hiểu biết pháp luật, hay là bởi vì ta sợ rằng nếu ta vi phạm thì người chấp pháp phát hiện ra được ngay? Just joking.

Anyway, mình rất mong được trao đổi thêm với bạn nào thực sự đang tìm hiểu về watermarking. Công việc vẫn là công việc mà lị.

#33
RongChoi

RongChoi

    Thượng sĩ

  • Founder
  • 215 Bài viết
Giữa thực tế và lý thuyết luôn là một khoảng cách rất xa và các phương pháp lý thuyết rất khó có thể giải quyết hoàn hảo tất cả các khía cạnh của thực tế.

Các nghiên cứu lý thuyết gồm rất nhiều mặt và mỗi nghiên cứu thường tiếp cận sâu về một mặt nào đó mà làm nhẹ đi các khía cạnh khác. Và khi làm nhẹ đi các khía cạnh khác, người ta thường giả thiết rằng những khía cạnh này đã được giải quyết. Ví dụ rằng, trong việc xây dựng phuơng pháp đánh dấu vân tay fingerprinting như collusion secure code, người ta chú trọng đến việc nếu nhiều kẻ cấu kết với nhau để tạo code giả thì làm thế nào có thể truy lùng lại những kẻ đã cấu kết. Khi đó, người ta làm giảm đi khía cạnh của watermaking và giải thiết rằng watermarking đã được giải quyết.
Chủ đề của mình nhấn vào khía cạnh ìtruy lùng” và do vậy làm nhẹ khía cạnh watermarking. Rất tiếc là do hạn chế về mặt thời gian mà ngay cả khía cạnh chính mình vẫn chưa hoàn thành.

Như một chủ đề rất có tính mở, việc chủ đề chuyển hướng sang watermarking cũng là một điều hết sức lý thú. Hy vọng werty98 có thể dẫn dắt mọi người đến những khía cạnh, những hiểu biết mới của vấn đề !

Chào mừng werty98 trên đường chạy tiếp sức!

#34
thanhluan001

thanhluan001

    Binh nhất

  • Thành viên
  • 22 Bài viết
Hi, mình là thành viên mới. Chưa đọc kĩ lắm tất cả các bài của các bạn nhưng cũng nhảy đại vào đây chơi.

Cryptography mà với đại diện là các giải thuật mã hóa dùng chìa khóa công khai đã đạt được kết quả cuối cùng sau mấy chục năm nghiên cứu, hiện nay đã được sử dụng rộng rãi. Đặc điểm cơ bản của cryptography là sử dụng cho peer-to-peer communications, người gửi và người nhận sử dụng khoá công khai hoặc bí mật để truyền dữ liệu an toàn (người thứ ba cho dù bắt được dữ liệu mã hóa nhưng không có chìa khoá để mở thì không sử dụng được dữ liệu).

Điểm yếu của cryptography là một khi dữ liệu đã được mở khóa rồi thì nó không còn được bảo vệ nữa. Về nguyên tắc, cryptography dùng cho liên lạc mà cả hai phía truyền nhận "tin tưởng" lẫn nhau. Để khắc phục khiếm khuyết này, người ta nghĩ ra watermarking.

Cryptoraphy, theo như các bạn cói thì chỉ có giá trị khi tất cả những người trong công ty sản xuất ra CD đều tin tưởng lẫn nhau vì nếu một kẻ phản bội tiết lộ bí mật khóa K thì dữ liệu coi như không còn được bảo vệ nữa. Nhưng em có ý này, nếu không có ai trong công ty đó thực sự có thể tin tưởng thì ta dùng một khóa K', mỗi người trong công ty sẽ có một phần của khóa K va K' là chìa khóa để kết hợp và giải mã khóa K. Trong trường hợp nay, ta chỉ cần một người thật sự có thể tin tưởng để giao cho khóa K' nhưng người này lại không được giữ thông tin về khóa K. Cuối cùng, vì không ai có được thông tin hoàn chỉnh về khóa K nên trừ khi cả công ty đều đồng ý cho ra một sản phẩm, không ai có thể làm giả được.

2- Mình đang làm watermarking on compressed data nên thấy thêm một câu chuyện "quả trứng và con gà" như thế này: trong khi watermarking cố gắng sử dụng các thông tin dư thừa của dữ liệu (VD như khoảng cách giữa các ký tự như có bạn đã trình bày ở trên) để gắn watermark vào nhằm không thay đổi giá trị sử dụng của dữ liệu thì việc nén dữ liệu lại cố gắng làm mất đi các thông tin dư thừa. Như vậy, nếu có một giải thuật nén tối ưu thì watermarking coi như đi đứt.


Em rất đồng ý với ý kiến ở trên: Nếu chúng ta dùng thông tin dư thừa để đánh dấu dữ liệu thì với một thuật toán nén tốt ưu, tất cả nhũng thông tin trên sẽ rơi rụng hết. Nhưng nếu chúng ta dùng valid thông tin để đánh dấu. Ví dụ như trong một bức tranh màu, mỗi màu là sự kết hợp của 3 màu: xanh, đỏ vàng. Nên khi tạo ra một màu, ta dùng 3 màu trên rồi pha trộn theo một tỉ lệ nào đó. Giả sử ta lấy màu X làm màu để mark thì ta chỉ cần chỉnh thông số của 3 màu xanh, đỏ , vàng trong 1 domain nhất định thì sẽ không thay đổi màu X nhiều lắm. Nhưng trong trường hợp này, không có công cụ nén nào lại có thể loại màu X ra được vì nếu thiếu màu X sẽ rất ảnh hưởng đến chất lượng tranh.

Trên đây, em chỉ trình bày ý tương của em, và cũng tùy thuộc vào dữ liệu nữa, quan trọng là mình phải tìm được giá trị X có thể thay đổi được và là một phần của dữ liêu.

#35
RongChoi

RongChoi

    Thượng sĩ

  • Founder
  • 215 Bài viết

Điểm yếu của cryptography là một khi dữ liệu đã được mở khóa rồi thì nó không còn được bảo vệ nữa. Về nguyên tắc, cryptography dùng cho liên lạc mà cả hai phía truyền nhận "tin tưởng" lẫn nhau. Để khắc phục khiếm khuyết này, người ta nghĩ ra watermarking.


Mình không làm về watermarking nhưng mìng không đồng ý lắm với quan điểm này của bạn. Cryptographie và watermarking tiếp cận đến 2 vấn đề cơ bản là khác nhau nêu mình không nghĩ watermarking sinh ra là để khác phục khiếm khuyết nào đó của cryptographie. Một trong những khác nhau lớn nhất là về yêu cầu của sự an toàn thông tin :
- Cryptographie (trong phạm vi hẹp này ta hiểu là encryption) nhắm đến bài toán một người muốn truyền một thông điệp "tuyệt mật" tới 1 hoặc 1 số người khác. Ví dụ là vị đại tướng muốn truyền lệnh từ xa cho chỉ huy một quân đoàn "Đánh vào lúc nửa đêm". Thông tin thường yêu cầu tuyệt mật và do vậy Cryptographie hướng tới bài toán không để lộ một chút thông tin nào. Kẻ địch chỉ cần giải mã được 1 phần nhỏ thông tin, cụ thể nếu nó giải mà được chữ "Đánh" trong thông điệp trên thì kế hoạch có lẽ sụp đổ vì mất tính bất ngờ!

- watermarking tiếp cận bài toán 1 nhà cung cấp muốn quảng bá một nội dung mà đảm bảo được vấn đề bản quyền. Như ở trên đã nói là một đĩa CD hay là chương trình ti vi, ... . Tất nhiên tuỳ từng trường hợp, nhưng yêu cầu chung là ngăn chặn những kẻ gian tái sản xuất được "hầu như toàn bộ" thông tin. Chẳng hạn truyền hình một trận đá bóng, nếu bộ giải mã giả chỉ giải mã được một nửa thì xem cứ phập phập phù phù ai mà chịu được :subset Hay đĩa nhạc cổ điển mà cứ thỉnh thoảng lại xoẹt xoẹt thì chắc không ai mua lại,...

Trong quá trình nghiên cứu watermarking, mình cảm nhận được hai mâu thuẫn sau của lý thuyết watermarking:
1- Việc đánh dấu watermark lên dữ liệu và việc attack để phá watermark đều không được làm mất đi giá trị sử dụng của dữ liệu (VD như không được làm suy giảm nhiều chất lượng của một bộ phim chẳng hạn). Tuy nhiên giá trị sử dụng của dữ liệu lại là một khái niệm hết sức mơ hồ, được đo đạc và so sánh hơi tuỳ tiện.


Với giới hạn của sự giới thiệu chung nên RC rất muốn tránh các khái niệm hình thức dẫn đến sự khó theo dõi. Tuy nhiên việc định nghĩa "giá trị" như bạn nói không phải là khó. Với mỗi mục đích ta đều có thể có những định nghĩa phù hợp :
Chẳng hạn vài cách định nghĩa đơn giản :
- đối với Cryptographie, độ dài văn bản là n, ta yêu cầu kẻ địch không thể tìm được một lượng thông tin c để c/n > epsilon. Hoặc theo cách hiện nay, người ta yêu cầu mức độ bảo mật là kẻ địch không thể tìm được 1 bít thông tin của bản gốc (c<1).
- tương tự, đối với vấn đề bản quyền, ta yêu cầu kẻ địch không thể sản xuất một bản giả với lượng thông tin c biểu thị gần như toàn bộ bản chính, tức là 1-c/n < delta cố định nào đó.

2- Mình đang làm watermarking on compressed data nên thấy thêm một câu chuyện "quả trứng và con gà" như thế này: trong khi watermarking cố gắng sử dụng các thông tin dư thừa của dữ liệu (VD như khoảng cách giữa các ký tự như có bạn đã trình bày ở trên) để gắn watermark vào nhằm không thay đổi giá trị sử dụng của dữ liệu thì việc nén dữ liệu lại cố gắng làm mất đi các thông tin dư thừa. Như vậy, nếu có một giải thuật nén tối ưu thì watermarking coi như đi đứt.


Đối với ý kiến về "quả trứng và con gà" của bạn, mình cũng không thông. Mình xem đó không phải là mâu thuẫn mà chỉ như một bài toán tối ưu 2 chiều bình thường : một chiều về phương diện nén và một chiều về phương diện "watermaking". Trội về phương diện này thì lại yếu về phương diện kia và vấn đề có thể đưa về việc tìm một biện pháp khả thi cho cả hai (tradeoff). Tuỳ từng yêu cầu riêng, ta có thể định nghĩa hàm "khả thi" mọt cách tường minh.

Rất mong bạn tiếp tục giới thiệu kỹ hơn về watermarking ...

#36
RongChoi

RongChoi

    Thượng sĩ

  • Founder
  • 215 Bài viết

Vấn đề "trong tuần" đã lâu hàng "mấy tháng" nên chắc mọi người cũng không cần tập trung vào vấn đề khởi đầu nữa. Mọi người có thể chuyển sang pha thảo luận về mọi mắc mớ riêng tùy ý.
Đối với vấn đề đầu tiên về "truy lùng dấu vết", tuy chưa đi đến lời giải cụ thể nhưng hy vọng bản thân vấn đề đã đáp ứng được phần nào tinh thấn ở bài viết khới đầu " (...) sau cuộc chơi mỗi người có thêm một sự thỏa mãn riêng, một sự mắc mớ riêng cho mình." :subset
RC


#37
vnguru

vnguru

    Lính mới

  • Thành viên
  • 3 Bài viết

Nếu chúng ta ghi dữ liệu lên một loại CD riêng, đặt hàng từ một hãng sản xuất nào đó thì khi tội phạm copy sẽ không có CD riêng đó để copy. Nếu có trong tay bản CD lậu chúng ta có thể bằng phương pháp khoa học hình sự tìm ra nhà chế tạo đĩa CD lậu đó, cách thức kẻ gian ghi đĩa lậu. việc làm này sẽ hạn chế việc copy lậu


Như thế thì sẽ tạo ra nạn độc quyền. sẽ phát sinh ra nhiều vấn đề phức tạp hơn. người chịu thiệt chính là người tiêu dùng. chúng ta cần có sự cạnh tranh mới phát triển được, đúng không nè. mà thật ra bọn tọi phạm có đầy cách để sản xuất CD giả. :in




0 người đang xem chủ đề

0 thành viên, 0 khách, 0 thành viên ẩn danh