Những điểm đau này đang ngăn cản các công ty chấp nhận học tập sâu

NộI Dung

Ứng dụng kinh doanh của Deep Learning
V V của dữ liệu lớn và học tập sâu
Không lỗi, không căng thẳng - Hướng dẫn từng bước của bạn để tạo ra phần mềm thay đổi cuộc sống mà không phá hủy cuộc sống của bạn
Thế lưỡng nan hộp đen
Quy định

Nguồn: Agsandrew / Dreamstime.com

Lấy đi:

Học sâu có rất nhiều để cung cấp cho các doanh nghiệp, nhưng nhiều người vẫn còn do dự để áp dụng nó. Ở đây chúng tôi xem xét một số điểm đau lớn nhất của nó.

Học sâu là một lĩnh vực của học máy, mà (nói chung) là công nghệ được lấy cảm hứng từ bộ não con người và các chức năng của nó. Được giới thiệu lần đầu tiên vào những năm 1950, học máy được thông tin tích lũy bởi cái được gọi là mạng nơ ron nhân tạo, rất nhiều nút dữ liệu được kết nối với nhau tạo thành cơ sở cho trí tuệ nhân tạo. (Để biết những điều cơ bản về học máy, hãy xem Machine Learning 101.)

Học máy về cơ bản cho phép các chương trình máy tính tự thay đổi khi được nhắc bởi dữ liệu ngoài hoặc lập trình. Theo tự nhiên, nó có thể thực hiện điều này mà không cần sự tương tác của con người. Nó chia sẻ chức năng tương tự với khai thác dữ liệu, nhưng với kết quả được khai thác sẽ được xử lý bằng máy chứ không phải con người. Nó được chia thành hai loại chính: học tập có giám sát và không giám sát.

Học máy được giám sát liên quan đến sự suy luận của các hoạt động được xác định trước thông qua dữ liệu đào tạo được dán nhãn. Nói cách khác, các kết quả được giám sát đã được người lập trình (con người) biết trước, nhưng hệ thống suy ra kết quả được đào tạo để học hỏi họ. Ngược lại, máy học không được giám sát sẽ rút ra các kết luận từ dữ liệu đầu vào không được gắn nhãn, thường là phương tiện để phát hiện các mẫu chưa biết.

Học sâu là duy nhất ở khả năng tự rèn luyện thông qua các thuật toán phân cấp, trái ngược với các thuật toán tuyến tính của học máy. Các hệ thống phân cấp học tập sâu ngày càng phức tạp và trừu tượng khi chúng phát triển (hoặc có thể học tập) và không dựa vào logic được giám sát. Nói một cách đơn giản, học sâu là một hình thức học máy tự động, tiên tiến và chính xác, và đi đầu trong công nghệ trí tuệ nhân tạo.

Ứng dụng kinh doanh của Deep Learning

Học máy đã được sử dụng phổ biến trong một số ngành công nghiệp khác nhau. Ví dụ, phương tiện truyền thông xã hội sử dụng nó để quản lý nguồn cấp nội dung trong dòng thời gian của người dùng. Google Brain được thành lập cách đây vài năm với mục đích tạo ra sự học hỏi sâu rộng trên phạm vi dịch vụ của Google khi công nghệ phát triển.

Tập trung vào phân tích dự đoán, lĩnh vực tiếp thị được đầu tư đặc biệt vào đổi mới học tập sâu. Và vì tích lũy dữ liệu là yếu tố thúc đẩy công nghệ, các ngành công nghiệp như bán hàng và hỗ trợ khách hàng (vốn đã sở hữu nhiều dữ liệu khách hàng phong phú và đa dạng) được định vị duy nhất để áp dụng nó ở cấp độ mặt đất.

Thích nghi sớm với học tập sâu rất có thể là yếu tố quyết định chính trong việc các ngành cụ thể được hưởng lợi bao nhiêu từ công nghệ, đặc biệt là trong các giai đoạn đầu tiên của nó. Tuy nhiên, một vài điểm đau cụ thể đang khiến nhiều doanh nghiệp không lao vào đầu tư công nghệ học tập sâu.

V V của dữ liệu lớn và học tập sâu

Năm 2001, một nhà phân tích của Tập đoàn META (nay là Gartner) tên là Doug Laney đã phác thảo những gì các nhà nghiên cứu nhận thấy là ba thách thức chính của dữ liệu lớn: khối lượng, sự đa dạng và vận tốc. Trong một thập kỷ rưỡi sau đó, sự gia tăng nhanh chóng các điểm truy cập internet (phần lớn là do sự phát triển của thiết bị di động và sự phát triển của công nghệ IoT) đã đưa những vấn đề này lên hàng đầu cho các công ty công nghệ lớn cũng như các doanh nghiệp nhỏ hơn và khởi nghiệp như nhau. (Để tìm hiểu thêm về ba v, hãy xem Thử thách dữ liệu lớn ngày nay bắt nguồn từ sự đa dạng, không phải khối lượng hoặc vận tốc.)

Không lỗi, không căng thẳng - Hướng dẫn từng bước của bạn để tạo ra phần mềm thay đổi cuộc sống mà không phá hủy cuộc sống của bạn

Bạn không thể cải thiện kỹ năng lập trình của mình khi không ai quan tâm đến chất lượng phần mềm.

Thống kê gần đây về việc sử dụng dữ liệu toàn cầu là đáng kinh ngạc. Các nghiên cứu chỉ ra rằng khoảng 90 phần trăm của tất cả các dữ liệu trên thế giới chỉ được tạo ra trong vài năm qua. Lưu lượng truy cập trên toàn thế giới lên tới khoảng bảy exabyte mỗi tháng trong năm 2016, theo một ước tính, và con số đó dự kiến sẽ tăng khoảng bảy lần trong nửa thập kỷ tới.

Ngoài khối lượng, sự đa dạng (sự đa dạng gia tăng nhanh chóng về các loại dữ liệu khi phương tiện mới phát triển và mở rộng) và vận tốc (tốc độ mà phương tiện điện tử được gửi đến trung tâm dữ liệu và trung tâm dữ liệu) cũng là những yếu tố chính trong cách các doanh nghiệp thích nghi với lĩnh vực đang phát triển học sâu. Và để mở rộng trên thiết bị ghi nhớ, một số từ v khác đã được thêm vào danh sách các điểm đau dữ liệu lớn trong những năm gần đây, bao gồm:

Hiệu lực: Việc đo lường độ chính xác của dữ liệu đầu vào trong các hệ thống dữ liệu lớn. Dữ liệu không hợp lệ không bị phát hiện có thể gây ra sự cố đáng kể cũng như phản ứng dây chuyền trong môi trường học máy.
Tính dễ bị tổn thương: Dữ liệu lớn tự nhiên gợi lên mối quan tâm về bảo mật, đơn giản là nhờ quy mô của nó. Và mặc dù có tiềm năng lớn được thấy trong các hệ thống bảo mật được kích hoạt bằng máy học, những hệ thống đó trong các phiên bản hiện tại của chúng được ghi nhận là thiếu hiệu quả, đặc biệt là do xu hướng tạo ra các báo động sai.
Giá trị: Chứng minh giá trị tiềm năng của dữ liệu lớn (trong kinh doanh hoặc ở nơi khác) có thể là một thách thức đáng kể cho bất kỳ lý do nào. Nếu bất kỳ điểm đau nào khác trong danh sách này không thể được giải quyết một cách hiệu quả, thì thực tế chúng có thể thêm giá trị âm cho bất kỳ hệ thống hoặc tổ chức nào, thậm chí có thể có tác động thảm khốc.

Các điểm đau tiêu chuẩn khác đã được thêm vào danh sách bao gồm tính biến thiên, tính xác thực, tính biến động và hình dung - tất cả đều đưa ra các thách thức độc đáo của riêng họ cho các hệ thống dữ liệu lớn. Và nhiều hơn nữa vẫn có thể được thêm vào như danh sách hiện tại (có thể) giảm dần theo thời gian. Mặc dù có vẻ hơi khó hiểu đối với một số người, nhưng danh sách này đã ghi lại những vấn đề nghiêm trọng đối mặt với dữ liệu lớn đóng vai trò quan trọng trong tương lai của việc học sâu.

Thế lưỡng nan hộp đen

Một trong những tính năng hấp dẫn nhất của học tập sâu và trí tuệ nhân tạo là cả hai đều nhằm giải quyết các vấn đề mà con người có thể. Tuy nhiên, hiện tượng tương tự được cho là cho phép điều đó, tuy nhiên, cũng đưa ra một vấn đề nan giải thú vị, xuất hiện dưới dạng những gì được biết đến với cái tên Hộp đen.

Mạng lưới thần kinh được tạo ra thông qua quá trình học sâu là rất rộng lớn và phức tạp đến mức các chức năng phức tạp của nó về cơ bản không thể hiểu được đối với sự quan sát của con người. Các nhà khoa học và kỹ sư dữ liệu có thể có sự hiểu biết thấu đáo về những gì đi vào hệ thống học tập sâu, nhưng làm thế nào họ đi đến quyết định đầu ra của họ thường xuyên hơn là không hoàn toàn không giải thích được.

Mặc dù điều này có thể không phải là một vấn đề quan trọng đối với các nhà tiếp thị hoặc nhân viên bán hàng (tùy thuộc vào những gì họ đang tiếp thị hoặc bán), các ngành công nghiệp khác yêu cầu một số lượng xác thực và lý luận nhất định để có được bất kỳ kết quả nào. Chẳng hạn, một công ty dịch vụ tài chính có thể sử dụng học tập sâu để thiết lập một cơ chế chấm điểm tín dụng hiệu quả cao. Nhưng điểm tín dụng thường phải đi kèm với một số loại giải thích bằng lời nói hoặc bằng văn bản, sẽ khó hình thành nếu phương trình chấm điểm tín dụng thực tế hoàn toàn mờ nhạt và không thể giải thích được.

Vấn đề này cũng mở rộng sang nhiều lĩnh vực khác, đặc biệt là trong lĩnh vực sức khỏe và an toàn. Y học và giao thông vận tải có thể có lợi ích cả về mặt chính trị từ việc học sâu, nhưng cũng phải đối mặt với một trở ngại đáng kể trong hình thức của hộp đen. Bất kỳ kết quả đầu ra nào trong các trường đó, cho dù có lợi ích đến đâu, đều có thể bị loại bỏ hoàn toàn trên tài khoản của các thuật toán cơ bản của chúng. Điều này đưa chúng ta đến điểm đau có thể gây tranh cãi nhất trong số họ

Quy định

Vào mùa xuân năm 2016, Liên minh châu Âu đã thông qua Quy định bảo vệ dữ liệu chung (GDPR), trong đó (trong số những thứ khác) cấp cho công dân quyền được giải thích về các quyết định tự động được tạo ra bởi các hệ thống máy học mà ảnh hưởng đáng kể đến họ. Được lên kế hoạch để có hiệu lực vào năm 2018, quy định này đang gây lo ngại cho các công ty công nghệ được đầu tư vào việc học sâu về tài khoản hộp đen không thể xuyên thủng của nó, trong nhiều trường hợp sẽ cản trở giải thích được ủy quyền bởi GDPR.

Hệ thống ra quyết định cá nhân tự động của Cameron mà GDPR dự định hạn chế là một tính năng thiết yếu của học tập sâu. Nhưng những lo ngại về công nghệ này là không thể tránh khỏi (và phần lớn có giá trị) khi khả năng phân biệt đối xử rất cao và tính minh bạch rất thấp. Tại Hoa Kỳ, Cục Quản lý Thực phẩm và Dược phẩm cũng quy định tương tự việc thử nghiệm và tiếp thị thuốc bằng cách yêu cầu các quy trình này phải được kiểm toán. Điều này đã gây ra những trở ngại cho ngành công nghiệp dược phẩm, như trường hợp của công ty công nghệ sinh học Biogen có trụ sở tại Massachusetts, đã bị ngăn không sử dụng các phương pháp học sâu không thể giải thích được do quy định của FDA.

Ý nghĩa của việc học sâu (đạo đức, thực tế và hơn thế nữa) là chưa từng có và, thẳng thắn, khá sâu sắc. Rất nhiều sự e ngại bao quanh công nghệ phần lớn là do sự kết hợp giữa tiềm năng đột phá của nó và logic và chức năng mờ đục của nó.Nếu các doanh nghiệp có thể chứng minh sự tồn tại của giá trị hữu hình trong học tập sâu vượt quá mọi mối đe dọa hoặc mối nguy hiểm có thể hiểu được, thì họ có thể giúp chúng ta vượt qua giai đoạn quan trọng tiếp theo của trí tuệ nhân tạo.