hật tượng hình. Tiếng Nhật có gần năm mươi ký tự, quá nhiều so với con số mười sáu mà phương pháp chia theo cặp đôi cho phép. Tiếng Anh và tiếng Pháp đều có hai sáu chữ cái, trong khi tiếng Ý chỉ có hai mươi. Nhưng anh cũng biết mình không thể bỏ qua khả năng thông điệp được viết bằng tiếng Nhật Latin hóa. Đôi khi việc xác định ngôn ngữ của mật mã chiếm một nửa phần công việc. Nhưng với Ando vấn đề này đã được giải quyết. Việc anh có thể thay thế những con số 178136 để cho ra chữ “ring” có thể xem là một gợi ý của Ryuji rằng mật mã hiện tại cũng cho ra kết quả dưới dạng tiếng Anh. Ando chắc chắn về điểm này. Do đó vấn đề ngôn ngữ đã được giải quyết. Bốn mươi hai chữ cái của các bazơ có thể chia ra thành hai mốt cặp. Nhưng có một số cặp giống hệt nhau: có bốn cặp AA, ba cặp TA, ba cặp TC, và hai cặp CC. Chỉ có mười ba kiểu cặp đôi. Ando viết lại các con số lên một tờ giấy và giở một cuốn sách hướng dẫn giải mật mã đến khi tìm hiểu được biểu đồ trình bày tần số xuất hiện của các ký tự trong bảng chữ cái tiếng Anh. Anh biết mặc dù bảng chữ cái tiếng Anh có hai sáu chữ cái, không phải tất cả các chữ cái đó xuất hiện với số lần ngang nhau trong ngôn ngữ sử dụng hàng ngày. Ví dụ E, T và A là những chữ cái thường xuất hiện, trong khi đó Q và Z có lẽ chỉ xuất hiện một hoặc hai lần trên một trang sách. Hầu hết các tài liệu hướng dẫn giải mật mã đều có rất nhiều dạng bảng tần số xuất hiện chữ cái được trình bày ở phần cuối, bên cạnh những số liệu thống kê tham khảo khác. Sử dụng các bảng và thống kê đó giúp xác định dễ dàng hơn ngôn ngữ của thông điệp được mã hóa. Trong trường hợp này, những số liệu trong các bảng cho anh biết rằng trong một cụm từ tiếng Anh có hai mốt chữ cái thì số lượng bình quân của các chữ cái khác nhau được sử dụng là mười hai. Ando ngồi thần ra. Cái anh đang có là mười ba chữ cái khác nhau, không hề quá nhiều so với số bình quân. Điều này, xét về mặt thống kê, cho anh biết rằng chẳng có gì sai khi chia chuỗi bazơ ra thành hai mốt cặp và giả định mỗi cặp đại diện ột chữ cái.Cân nhắc khả năng đó một lát, bước tiếp theo Ando chia chuỗi bazơ thành từng bộ ba chữ cái: ATG GAA GAA GAA TAT CGT TAT CCT CCT CAA CAA CAA ATT CCT Việc phân chia này ười bốn bộ ba, hay bảy kiểu bộ ba: ATG, GAA, TAT, CGT, ATT, CCT và CAA. Biểu đồ cho anh biết rằng một cụm từ tiếng Anh mười bốn chữ cái chứa bình quân chín chữ cái khác nhau. Không quá nhiều so với bảy chữ cái anh có. Ngay lập tức Ando nhận thấy rằng phân chia theo cách này có rất nhiều sự trùng lặp. GAA, CCT và CAA mỗi bộ xuất hiện ba lần, và TAT xuất hiện hai lần. Nhưng điều thực làm Ando băn khoăn GAA, CCT và CAA xuất hiện ba lần liên tiếp. Nếu anh gán ỗi bộ ba một chữ cái thuộc hệ alphabet, trong thông điệp ngắn ngủi này có ba trường hợp một chữ cái xuất hiện ba lần liên tiếp. Vốn tiếng Anh của Ando đủ để anh biết rằng hai chữ cái trùng lặp đứng cạnh nhau hoàn toàn không phải là hiếm. Nhưng anh không thể nghĩ ra một từ tiếng Anh nào có ba chữ cái giống nhau đứng cạnh nhau. Khả năng duy nhất anh có thể nghĩ đến là tình huống trong đó một từ kết thúc với hai chữ cái giống nhau, và từ tiếp theo bắt đầu bằng chính chữ cái đó, ví dụ “too old” hoặc “will link”. Anh cầm lên một quyển sách tiếng Anh tình cờ tìm thấy ở gần đó và bắt đầu kiểm tra ngẫu nhiên một trang xem mức độ thường xuyên một chữ cái xuất hiện ba lần liên tiếp. Anh giở qua bốn hay năm trang gì đấy mới tìm được một trường hợp. Anh kết luận rằng khả năng sự xuất hiện này xảy ra ba lần trong một chuỗi mười bốn chữ cái về cơ bản là bằng không. Ngược lại, chia bốn hai chữ cái này theo các cặp đôi thì chỉ có một chữ cặp ký tự đứng cạnh nhau. Do đó, anh thấy rằng sẽ hợp lý hơn khi đi theo lựa chọn đầu tiên và chia bazơ thành các nhóm hai chữ cái. Anh đã thu hẹp các khả năng. Từ đây anh có thể tiếp tục bằng phương pháp thử và lỗi. AT GG AA GA AG AA TA TC GT TA TA TT CC TC CT CC TC AA CA AC AA Cặp AA xuất hiện bốn lần, điều đó có nghĩa là nó tương ứng với một chữ cái được dùng đến rất thường xuyên. Tham khảo một bảng khác, Ando khẳng định chữ cái thường được dùng nhất trong tiếng Anh là E. Do đó, anh giả sử rằng AA nghĩa là E. Cặp chữ phổ biến thứ hai trong dãy là TA và TC, mỗi cặp xuất hiện ba lần. Anh cũng nhận thấy TA đứng sau AA một lần, còn AA đứng sau TC một lần. Điều này có thể quan trọng, do cũng có những thống kê về sự kết hợp các chữ cái. Anh bắt đầu thử các khả năng khác nhau của TA và TC, bằng cách tham khảo các bảng thống kê. Với những chữ thường đứng sau chữ E và cũng là những chữ phổ biến, chữ A dường như là ứng cử viên khả dĩ nhất, điều đó có nghĩa là TA có thể là A. Theo logic này, anh nghĩ TC có lẽ tương ứng với chữ T. Hơn nữa, theo cách kết hợp với các chữ cái khác, anh đoán CC có thể là N. Cho đến lúc đó, các số liệu thống kê dường như phục vụ cho anh rất tốt. Ít ra anh không gặp phải trục trặc nào cả. Đây là những chữ cái anh đã tìm ra: ˍˍEˍˍEATˍAAˍNTˍNTEˍˍE Dãy bazơ, từng là mớ chữ cái lộn xộn, giờ dường như có vẻ giống với tiếng Anh. Bước tiếp anh cố điền vào những chỗ trống bằng cách dựa trên những điều anh biết về sự kết hợp giữa các phụ âm – nguyên âm, và vẫn tham khảo các bảng. SHERDEATYAALNTINTECME Ba chữ cái đầu tiên dường như tạo thành chữ “she”, nhưng những chữ còn lại không lập thành chữ nào cả, cho dù anh có chia ra như thế nào. Anh cố đảo vị trí của các chữ E, A, T, N và thay đổi các chữ cái khác dựa vào linh cảm. Khi việc viết những khả năng ra trên giấy trở nên quá mất thời gian, anh xé những tờ giấy ra khỏi cuốn sổ, trước hết là để tạo ra hai sáu cái thẻ, mỗi thẻ ứng với một chữ cái. Mọi việc bắt đầu giống như một trò chơi. THEYWERBORRLNBINBECME Khi sắp xếp như thế này, cụm từ đầu tiên nảy ra trong đầu Ando là “they were born”. Anh biết phần chính tả có đôi chút sai lệch, nhưng có lẽ cũng không quá sai. Vả lại anh thấy ý nghĩa của nó có phần nào hợp lý. Nhưng cảm giác rằng tồn tại đâu đó một cách sắp xếp khác hợp lý hơn, nên anh tiếp tục trò chơi. Sau khoảng mười phút mày mò, Ando nghĩ anh có thể đoán ra kết quả sẽ như thế nào, nên anh dừng lại. Nếu như bên cạnh có một máy vi tính, mọi việc sẽ dễ dàng hơn rất nhiều, anh nghĩ. Những chữ cái thứ ba, sáu, tám và hai mốt giống nhau. Chữ thứ bảy, mười và mười một giống nhau. Chữ thứ tám, mười bốn và mười bảy giống nhau. Chữ thứ mười ba và mười sáu giống nhau. Cụm từ dài hai mốt chữ cái. Nếu anh lập các điều kiện đó và đưa vào máy tính, có lẽ nó sẽ cho ra kết quả, với điều kiện anh có điều chỉnh phù hợp về chữ cái thường được sử dụng. Nhưng chắc chắn máy tính sẽ cho ra nhiều kết quả khả dĩ. Hẳn là phải có vô số cụm từ có nghĩa trong tiếng Anh thỏa mãn những điều kiện ấy. Làm sao anh có thể nói cụm từ nào là thông điệp Ryuji gửi cho anh? Chỉ khi có dấu hiệu nào trong đáp án có thể cho anh biết ngay khi nhìn qua rằng đó là thông điệp của Ryuji, giống như kiểu một chữ ký vào cuối bức thư. Nhưng nếu không có, anh sẽ lạc lối. Ando nhận ra rằng anh đang ở vào ngõ cụt. Anh gục đầu, thấy mình thật ngu ngốc vì đến giờ mới nhận ra điều này. Nếu trở lại thời sinh viên, khi linh cảm giải mật mã của