Mã hóa đồng hình có sẵn sàng cung cấp điện toán đám mây bí mật cho các doanh nghiệp không?

0
17

        Khả năng giữ dữ liệu được mã hóa trong khi bạn sử dụng nó để tính toán trong đám mây có thể bảo vệ dữ liệu khỏi những kẻ tấn công và những kẻ nội gián độc hại. Vẫn còn một cú hích hiệu năng, nhưng bạn có thể bắt đầu sử dụng các thư viện nguồn mở để tận dụng lợi thế đó.
    

        
                                                                                    
                        

                 ] ]
    

     Tại sao mã hóa sau lượng tử sẽ rất quan trọng để bảo vệ các máy tính cổ điển hiện tại
     Máy tính lượng tử được lý thuyết hóa có khả năng phá vỡ mã hóa RSA. Các chuyên gia không đồng ý khi nào nó có thể xảy ra, nhưng đồng ý về nhu cầu mã hóa bằng chứng lượng tử.
    

    

Điện toán đám mây trên dịch vụ đám mây được chứng nhận, tuân thủ đúng như Microsoft Azure có thể sẽ an toàn hơn nhiều so với các máy chủ tại cơ sở trong văn phòng hoặc trung tâm dữ liệu của bạn. Dữ liệu của bạn được mã hóa ở phần còn lại và trong chuyển động; hệ thống đám mây có thể được vá thường xuyên hơn và được cấu hình an toàn hơn so với máy chủ của bạn; và quyền truy cập quản trị viên bị khóa và chỉ được bật cho 'quyền truy cập vừa đủ, đúng lúc' để chạy các lệnh cụ thể trong các cửa sổ thời gian cụ thể. Ngoài ra, quản trị viên sẽ trải qua kiểm tra lý lịch và làm việc tại các địa điểm an toàn yêu cầu thông tin sinh trắc học để truy cập.

    

                    
        
                

Tuy nhiên, vẫn còn có vấn đề. Bạn phải tin tưởng rằng dịch vụ đám mây đang lưu trữ và quản lý dữ liệu của bạn một cách an toàn và không để quản trị viên hoặc bất kỳ bên thứ ba nào nắm giữ nó. Quản trị viên của bạn có quyền truy cập đặc quyền vào dữ liệu trên đám mây đó, vì vậy bạn cần bảo vệ chống lại các mối đe dọa trong nội bộ. Và khi bạn thực sự muốn sử dụng dữ liệu đó – cho AI, phân tích hoặc chỉ truy vấn cơ sở dữ liệu – nếu bạn đang sử dụng mã hóa truyền thống, trước tiên cần phải tải xuống và giải mã hoặc bạn cần lưu trữ khóa mã hóa của mình trên đám mây.

XEM: Báo cáo đặc biệt: Chiến lược giành chiến thắng cho an ninh mạng (PDF miễn phí) (TechRepublic)

một vấn đề về thông tin bí mật hoặc đặc quyền (cho dù đó là thông tin nhận dạng cá nhân được bảo vệ bởi pháp luật như GDPR, hồ sơ tài chính hoặc dữ liệu y tế), đặc biệt nếu bạn đang cố gắng sử dụng dữ liệu được chia sẻ với bạn bởi một tổ chức khác kiểm soát mã hóa. Các dịch vụ như Azure Data Share cho phép các tổ chức quản lý và kiểm soát chia sẻ dữ liệu với các đối tác, nhưng dữ liệu chỉ được mã hóa trong quá trình và khi nghỉ ngơi.

Mã hóa đồng cấu bảo tồn các cấu trúc toán học làm nền tảng cho dữ liệu được mã hóa, do đó bạn có thể thực hiện tính toán trên dữ liệu mà không cần giải mã nó. Nếu hàm đồng hình mã hóa 400 thành 4 và 200 thành 2, bạn có thể chia các số được mã hóa cho nhau và nhận được kết quả tương tự như chia các số không được mã hóa.

Mã hóa trong các chức năng của các sơ đồ đồng hình thực tế phức tạp hơn đáng kể: thường chúng sử dụng phép tính toán liên quan đến các mạng có số lượng kích thước lớn, được gọi là vấn đề Ring-Learning With Error (RLwe). Điều đó ít nhất là an toàn như các sơ đồ mã hóa tiêu chuẩn, nhưng không giống như các phương pháp hiện tại, nó không phải là thứ mà máy tính lượng tử sẽ có thể phá vỡ.

Kết quả tính toán cũng được mã hóa. Điều này giúp ích cho việc bảo vệ khối lượng công việc bạn đang chạy trên đám mây, để thực hiện phân tích tổng hợp trên đám mây (nơi bạn đang xem qua một lượng lớn dữ liệu, thay vì chi tiết cụ thể của một thứ), để tự động hóa và sắp xếp nơi mã hóa dữ liệu có thể kích hoạt một sự kiện và đặc biệt là xử lý thông tin về chuỗi cung ứng và đối tác từ bên ngoài tổ chức của bạn.

Nếu bạn làm việc với đối tác hoặc nhà cung cấp, bạn có thể chia sẻ dữ liệu được mã hóa và chỉ có quyền truy cập vào dữ liệu bạn có chung, vì vậy bạn có thể sử dụng bộ dữ liệu kết hợp của mình để học máy. Hoặc các tổ chức có thể thu thập thông tin từ khách hàng đã được mã hóa, nơi khách hàng sở hữu khóa mã hóa và vẫn làm việc với nó, mà không bao giờ nhìn thấy dữ liệu thực tế. Vì mã hóa đồng hình hiện có thể được sử dụng với các thuật toán học sâu, các phiên bản tương lai của dịch vụ học máy đám mây như Azure Cognitive Services có thể hoạt động trên dữ liệu được mã hóa, cho dù đó là dịch một hợp đồng bí mật hoặc OCRing hồ sơ y tế, hoặc phân tích thông tin di truyền để xem ai đó có nguy cơ bị đau tim, mà không bị rò rỉ thông tin.

Việc ẩn danh dữ liệu không đủ để bảo vệ dữ liệu đó: một khi bạn bắt đầu làm việc với một lượng lớn dữ liệu, tương quan hoặc lỗi người dùng có thể dữ liệu sẽ được xác định lại, vô tình hoặc cố ý – nhưng điều đó có thể ' T xảy ra nếu nó không bao giờ được giải mã.

Đó là một tầm nhìn lớn: hôm nay bạn có thể làm được bao nhiêu?

Thực hiện mã hóa đồng cấu thực tế

Mã hóa đồng cấu không phải là một ý tưởng mới, nhưng phải mất một thời gian để trở nên thiết thực. Được đề xuất lần đầu vào năm 1978, thậm chí không có một thuật toán lý thuyết nào cho đến năm 2009 – và điều đó sẽ mất nhiều thời gian hơn một nghìn tỷ lần so với một phép tính không được mã hóa. Vào năm 2013, IBM Research đã giảm tốc độ xuống hàng triệu lần, do đó, một hoạt động dữ liệu sẽ mất một giây mà không cần mã hóa vẫn sẽ mất 12 ngày với mã hóa đồng cấu.

Microsoft Research đã thực hiện một cách tiếp cận hơi khác, chỉ định trước một số tham số cho các truy vấn, như kích thước của tập dữ liệu, các trường cụ thể sẽ cần, giới hạn phạm vi dữ liệu trong các trường đó (vì vậy một trường tuổi sẽ không âm hoặc lớn hơn 150, nói) hoặc bạn sẽ làm bao nhiêu tính toán. Đó là mã hóa đồng cấu 'thực tế' là cơ sở của Thư viện số học mã hóa đơn giản (SEAL) của Microsoft Research, được mở nguồn vào năm 2018.

 microsoft-seal.jpg

Với mã hóa đồng cấu của Microsoft SEAL, các nhà khai thác đám mây không bao giờ có quyền truy cập không được mã hóa vào dữ liệu họ đang lưu trữ và thao tác, vì việc tính toán được thực hiện trực tiếp trên dữ liệu được mã hóa.

                                            Hình ảnh: Microsoft
                                        

SEAL là một thư viện C ++ với trình bao bọc tiêu chuẩn cho C #, và nó hoạt động trên C ++ Windows, macOS và Linux. Nó bắt đầu được tích hợp vào các khung công tác cấp cao hơn: HE-Transformer của Intel sử dụng SEAL để thực hiện tính toán trên dữ liệu được mã hóa với trình biên dịch mạng thần kinh Nervana nGraph và các khung như TensorFlow. SEAL cũng bao gồm các bản demo để chỉ cho bạn cách xây dựng nó thành các ứng dụng: cho đến nay, bao gồm việc sử dụng nó với Azure Function và trong một ứng dụng Android để theo dõi bài tập. (Vâng, đó có thể là dữ liệu bí mật: một số trang web theo dõi tập thể dục trên đám mây đã kết thúc việc rò rỉ thông tin từ chi tiết tài khoản người dùng đến vị trí của các căn cứ quân sự.)

Bạn không thể chạy các tính toán tùy ý, nhưng chỉ định các tham số có nghĩa là, mặc dù vẫn có một chi phí đáng kể, thay vì hoạt động chậm hơn 12 bậc so với làm việc với dữ liệu không được mã hóa, thì chỉ có ba hoặc bốn. Vào năm 2015, các mạng thần kinh sử dụng mã hóa đồng cấu (mà Microsoft gọi là CryptoNets) có thể nhận ra các số viết tay với độ chính xác 99% với tốc độ gần 60.000 một giờ (trên PC Xeon 3,5 GHz chạy Windows 10). Một dự đoán duy nhất từ ​​OCR CrypoNet mất 250 giây, nhưng 4.096 dự đoán cũng vậy, bởi vì mã hóa đồng hình là song song lớn.

Trên máy tính để bàn có Core i7 đơn luồng, tùy thuộc vào mức độ tính toán mà các tham số chỉ định bạn sẽ thực hiện, nhân số với SEAL mất khoảng từ 500 micro giây đến 105 mili giây. Nhưng khi bạn tính trung bình trên tất cả các số bạn có thể xử lý song song, thời gian sẽ giảm xuống còn nano giây trên mỗi thao tác. Tương tự, việc chọn dữ liệu từ một tập dữ liệu được mã hóa lớn mất vài giây thay vì vài ngày. Hiện tại SEAL chỉ sử dụng CPU, nhưng vì nó rất song song, nên việc tăng tốc GPU (nằm trong lộ trình) sẽ cải thiện hiệu suất khoảng hai bậc độ lớn.

XEM: Mạng tối: Hướng dẫn cho các chuyên gia kinh doanh (PDF miễn phí) (TechRepublic)

Điều đó thực tế, nhưng SEAL vẫn còn nhiều vấn đề được nhắm mục tiêu và một lượng nhỏ thông tin bí mật hơn là xử lý tất cả dữ liệu của bạn. Microsoft đang sử dụng mã hóa đồng cấu trong hệ thống ElectionGuard của mình để xác minh bỏ phiếu từ đầu đến cuối. Để có hiệu suất chính hơn, SQL Server Luôn được mã hóa mô phỏng mã hóa đồng cấu hoàn toàn trên mã hóa tiêu chuẩn bằng cách sử dụng phần cứng đáng tin cậy.

Cộng đồng mật mã cũng có xu hướng cần thời gian để áp dụng các kỹ thuật mã hóa mới, để hiểu các vấn đề và làm việc thông qua các tiêu chuẩn. Thông thường phải mất khoảng mười năm và mã hóa đồng hình đang bắt đầu chuyển qua quy trình tiêu chuẩn. Hiện tại, các cuộc thảo luận là về thông số kỹ thuật để nói rằng mã hóa mạnh đến mức nào; bước tiếp theo sẽ là lấy một bộ API chung để các hệ thống mã hóa đồng hình có thể tương tác với nhau.

Ngày nay, mã hóa đồng hình là thứ bạn sẽ suy nghĩ cẩn thận khi áp dụng, mặc dù nó đáng để làm nếu nó cho phép bạn làm việc với dữ liệu được nhắm mục tiêu mà bạn không thể sử dụng. Nhưng một khi chúng ta thấy tiêu chuẩn hóa và tăng tốc phần cứng, nó có thể sẽ được áp dụng rộng rãi hơn trong tương lai không xa, do có bao nhiêu tổ chức dữ liệu bí mật muốn làm việc.

                                                                                

                                                

Cũng xem

Tại sao mã hóa sau lượng tử sẽ rất quan trọng để bảo vệ các máy tính cổ điển hiện tại

Mã hóa: Một bảng cheat

Làm thế nào các tổ chức có thể tự bảo vệ mình tốt hơn trước các mối đe dọa an ninh chuỗi cung ứng

Tại sao vi phạm dữ liệu cứ xảy ra trình diễn công nghệ ElectionGuard để bảo vệ máy bỏ phiếu điện tử (ZDNet)