Các nhà khoa học dữ liệu: Những ngôi sao nhạc rock mới của thế giới công nghệ

Tác Giả: Robert Simon
Ngày Sáng TạO: 24 Tháng Sáu 2021
CậP NhậT Ngày Tháng: 24 Tháng Sáu 2024
Anonim
Các nhà khoa học dữ liệu: Những ngôi sao nhạc rock mới của thế giới công nghệ - Công Nghệ
Các nhà khoa học dữ liệu: Những ngôi sao nhạc rock mới của thế giới công nghệ - Công Nghệ

NộI Dung


Nguồn: Onradio / iStockphoto

Lấy đi:

Vai trò nhà khoa học dữ liệu đang nhanh chóng trở thành nghề nghiệp được tìm kiếm nhiều nhất của thế giới công nghệ. Chúng tôi đã hỏi nhà khoa học dữ liệu hàng đầu Jake Porway từ Thời báo New York về cách anh ấy có được công việc và những lời khuyên để thành công trong lĩnh vực này.

Vai trò nhà khoa học dữ liệu đang nhanh chóng trở thành nghề nghiệp được tìm kiếm nhiều nhất trong thế giới công nghệ. Các công ty như Google, Amazon và LinkedIn đang sử dụng các nhà khoa học dữ liệu để giúp họ duy trì lợi thế sáng tạo đó trong kỷ nguyên dữ liệu số. Và bây giờ những người đam mê dữ liệu và công nghệ đang khao khát trở thành nhà khoa học dữ liệu giống như cách một số nhạc sĩ khao khát trở thành ngôi sao nhạc rock. Có lẽ đó là lý do tại sao một số người đề cập đến các nhà khoa học dữ liệu như những ngôi sao nhạc rock mới của kỷ nguyên công nghệ.


Thật không may, vai trò này vẫn còn quá mới đến nỗi vẫn còn một mức độ mơ hồ về nó, điều đó có nghĩa là nhiều nhà khoa học dữ liệu của Wannabe đang lái xe buýt du lịch của họ đi sai đường. Các nhà khoa học dữ liệu có xứng đáng với danh tiếng ngôi sao nhạc rock của họ? Chúng tôi đi sâu vào thế giới của khoa học dữ liệu bằng một cuộc phỏng vấn với Jake Porway, nhà khoa học dữ liệu từ phòng thí nghiệm R & D tại New York Times.

Các nhà khoa học dữ liệu: Techs Rock Stars?

Vậy tại sao các nhà khoa học dữ liệu được gọi là ngôi sao nhạc rock mới của thế giới công nghệ? Sự tương tự này thực sự đi sâu hơn so với mong muốn dữ liệu mong muốn âm thanh ultracool. Giống như một ngôi sao nhạc rock, sự nghiệp của các nhà khoa học dữ liệu bao gồm sự đa dạng, tự do nghệ thuật và khả năng thích ứng. Và giống như các ngôi sao nhạc rock của thế giới giải trí, các nhà khoa học dữ liệu giỏi nhất có xu hướng thu hút được khá nhiều người từ tất cả các ngành công nghiệp dữ liệu và công nghệ.


Những gì một nhà khoa học dữ liệu làm là rất đa dạng; giống như các nhạc sĩ sử dụng các nhạc cụ, công cụ và kỹ thuật khác nhau để chơi các phong cách âm nhạc khác biệt như nhạc jazz và kim loại chết, một nhà khoa học dữ liệu cũng làm chủ một công cụ và lĩnh vực cụ thể. Có phong cách liên quan, quá. Và cũng không có cách nào đúng hay sai khi thực hiện công việc - đó là về tác động của công việc đối với người khác.

Khi nhóm The Beatles viết bài hát của họ, chỉ có một người chỉ ra cách chơi từng nốt nhạc trên mỗi nhạc cụ. Họ đến với nhau và bị kẹt; thông qua khám phá sáng tạo họ đã tìm thấy những bài hát làm việc Nó giống nhau cho các nhà khoa học dữ liệu. Họ phải cảm nhận nhịp điệu, đi vào rãnh và hài hòa một giải pháp. Điều này chỉ có thể với một lượng tự do nghệ thuật phù hợp để thử mọi cách tiếp cận, công cụ và kỹ thuật có thể xuất hiện trong tâm trí - và sự nhanh nhẹn để thay đổi khi có gì đó không chính xác.

Một khi một nhà khoa học dữ liệu nắm vững các nguyên tắc cơ bản cốt lõi, anh ta hoặc cô ta trở nên thích nghi và có được sự tự tin để cung cấp các giải pháp trong các lĩnh vực khác. Chúng ta nói nhiều hơn về những nguyên tắc cơ bản cốt lõi này sau. Vấn đề cần làm ở đây là một khi bạn thành thạo khoa học dữ liệu, bạn có thể đảm nhận vai trò cho bất kỳ lĩnh vực nào bạn muốn, bởi vì dữ liệu ở khắp mọi nơi.

Một mục tiêu cuối cùng của nhà khoa học dữ liệu là tạo ra lượng giá trị khổng lồ cho số lượng người lớn nhất có thể. Mặc dù một nhà khoa học dữ liệu làm việc đằng sau hậu trường, nhưng nó không giống như chơi với một lượng lớn khán giả: Bạn càng làm tốt công việc, bạn càng tiếp cận được nhiều người - và bạn càng nhận được nhiều phần thưởng.

Các nhà khoa học dữ liệu làm gì?

Vậy các nhà khoa học dữ liệu làm gì chính xác? Hãy xem xét điều này với một ví dụ mà tất cả chúng ta có thể có thể liên quan đến.

Không lỗi, không căng thẳng - Hướng dẫn từng bước của bạn để tạo ra phần mềm thay đổi cuộc sống mà không phá hủy cuộc sống của bạn

Bạn không thể cải thiện kỹ năng lập trình của mình khi không ai quan tâm đến chất lượng phần mềm.

Hãy nói rằng bạn nhận ra một ngày nào đó bạn không có năng lượng như ngày trước. Vì vậy, bạn đặt cho mình một mục tiêu: có nhiều năng lượng hơn trong ngày. Bây giờ, đó là một mục tiêu khá rộng và mơ hồ. Vì vậy, bước đầu tiên của một nhà khoa học dữ liệu là loại bỏ một số sự mơ hồ đó và định lượng mục tiêu này có thể đo lường được. Có phương pháp cho việc này. Chúng tôi sẽ không đi sâu vào chi tiết ở đây, nhưng hãy nói rằng bạn đưa ra giả thuyết rằng bạn không ngủ đủ giấc và do đó hãy đặt cho mình mục tiêu phụ là ngủ đủ 8 tiếng mỗi đêm.

Mặc dù mục tiêu này có thể đo lường hơn một chút và ít mơ hồ hơn, nhưng nó có những thách thức riêng. Bạn không thể thực sự bắt đầu hẹn giờ một khi bạn ngủ, và ngay cả khi bạn bắt đầu hẹn giờ sau khi bạn đi ngủ, bạn có thể không ngủ ngay lập tức. Ngoài ra, thật khó để tính đến những lần bạn thức dậy vào giữa đêm. Cuối cùng, có nhiều loại giấc ngủ khác nhau, chẳng hạn như ngủ sâu và ngủ nhẹ. Điểm mấu chốt là khó đo chính xác giấc ngủ và do đó khó đo lường tác động của nó đến mức năng lượng của bạn.

vậy, bạn có thể làm gì? Vâng, là một nhà khoa học dữ liệu, bạn sẽ tìm kiếm công nghệ mới nhất và khám phá ra rằng có những thiết bị theo dõi giấc ngủ.Và nếu bạn đã sử dụng một thiết bị như vậy để đo và ghi lại kỹ thuật số giấc ngủ của mình, bạn sẽ có thể nhận được dữ liệu chính xác hơn về giấc ngủ của mình và thu thập dữ liệu đó theo thời gian để vẽ biểu đồ.

Điều này một mình có thể cung cấp cho bạn cái nhìn sâu sắc hơn về những gì đang xảy ra. Các đại diện trực quan sẽ cung cấp cho bạn nhận thức, rõ ràng và hướng. Bạn sẽ có thể xem liệu bạn có đạt được mục tiêu tám giờ ngủ mỗi đêm hay không và quan trọng hơn là có thể hành động nếu bạn không.

Đây là công việc cơ bản của nhà khoa học dữ liệu: mang đến những cách đo lường và hiển thị dữ liệu mới để nhận thức rõ ràng hơn, rõ ràng hơn và định hướng cho những người nhìn vào nó.

Nhưng một nhà khoa học dữ liệu giỏi không dừng lại ở đó. Sau khi dữ liệu được thu thập, nó có thể được tích hợp với bất kỳ hoạt động đo lường nào khác mà bạn thực hiện trong suốt cả ngày. Tích hợp nó với năng suất của bạn dựa trên dữ liệu từ hệ thống quản lý tác vụ của bạn. Tích hợp nó với tâm trạng của bạn dựa trên các tweet và cập nhật trạng thái. Tích hợp nó với sức khỏe của bạn dựa trên các lần đến phòng tập thể dục hoặc giảm cân. Với lượng dữ liệu đã có sẵn và sự dễ dàng có thể nắm bắt được, khả năng là vô tận.

Làm thế nào để trở thành một nhà khoa học dữ liệu

Quan tâm đến một nghề nghiệp trong khoa học dữ liệu? Bởi vì khoa học dữ liệu còn rất mới, chúng tôi đã hỏi một nhà khoa học dữ liệu hàng đầu về cái nhìn sâu sắc về lĩnh vực này. Jake Porway là một nhà khoa học dữ liệu tại Thời báo New York và là người sáng lập DataKind (ban đầu được gọi là Dữ liệu không biên giới), phù hợp với các tổ chức phi lợi nhuận cần khoa học dữ liệu với các nhà khoa học dữ liệu tự do và chuyên nghiệp. Porway có một nền tảng khoa học máy tính và bằng tiến sĩ. trong thống kê từ UCLA. Đây là những gì anh ấy đã nói về cách đi vào khoa học dữ liệu, làm thế nào để thực hiện tốt và làm thế nào để tránh những sai lầm chính trong lĩnh vực này.

1. Có được những kỹ năng phù hợp

Theo Porway, đi vào lĩnh vực sôi nổi với ba điều quan trọng:

  • Kỹ năng tính toán thực tế
  • Kỹ năng thống kê
  • Mong muốn học hỏi

"Bạn cần có khả năng viết các tập lệnh để cạo dữ liệu cũng như mã hóa các thuật toán bạn nghĩ ra trong đầu," Porway nói. "Bạn nên biết các số liệu thống kê cơ bản của mình (và hơn thế nữa, lý tưởng nhất) nếu bạn thực sự có thể đánh giá xem các mô hình bạn đang xây dựng hoặc thuật toán bạn đang viết có đang làm những gì bạn muốn hay không."

2. Thực hiện kết nối

Trước khi tham gia phòng thí nghiệm R & D của New York Times, Porway đã làm việc trong lĩnh vực máy học và thị giác máy tính, và dành nhiều thời gian để robot xác định bom mìn và máy bay (thật tuyệt cái đó?). Mãi cho đến khi anh tìm được công việc của mình tại Thời báo New York, anh mới mở rộng sang các nhiệm vụ khoa học dữ liệu rộng hơn, cụ thể là Project Cascade, theo dõi các liên kết từ ấn phẩm trên phương tiện truyền thông xã hội.

Điều quan trọng nhất để có được trong lĩnh vực này, porway nói, là để có được học tập.

"Nhận một dự án khoa học dữ liệu!" Porway nói. "Tải xuống một số dữ liệu, chọn một số R và bắt đầu chơi ... Id nói hãy tập trung vào việc sử dụng thứ gì đó như R cùng với một cuốn sách thống kê cơ bản để hướng dẫn bạn khám phá một số dữ liệu. Kỹ năng học máy và máy tính sẽ đi kèm với ( tất nhiên điều này phụ thuộc vào kinh nghiệm trong quá khứ của bạn - nếu bạn đã là một nhà thống kê, hãy chọn một số Python!) "

Sau đó là thời gian để thực hiện một số kết nối. Porway đề xuất một nhóm gặp gỡ địa phương - bởi vì là một phần của cộng đồng khoa học dữ liệu là "cách nhanh nhất để biết những gì bạn không biết." Và trong một lĩnh vực không ngừng phát triển, đó là vấn đề.

3. Tham gia trò chơi

Porway có bằng tiến sĩ. trong thống kê từ UCLA, nhưng ông nhấn mạnh rằng bạn không cần một người để làm việc tốt.

"Nó có thể giúp ích, nhưng đừng nghĩ rằng bạn phải nghỉ học và học thêm năm năm nữa để có thể tự gọi mình là nhà khoa học dữ liệu", Porway nói.

Khoa học dữ liệu là một lĩnh vực tương đối mới. Điều này có nghĩa là những người muốn tham gia vào lĩnh vực này cần tiếp cận nó với một tâm trí cởi mở.

"Một nhà khoa học dữ liệu tại Foursquare sẽ trông khác rất nhiều so với một nhà khoa học dữ liệu tại Goldman Sachs," Porway nói.

4. Đá vai trò mới của bạn

Khoa học dữ liệu là tất cả về việc làm rõ các mục tiêu, kiểm tra các giả định, đánh giá bằng chứng và đánh giá kết luận. Nhưng có một mảnh nhỏ của câu đố nhiều người bỏ qua. Bạn có đoán được nó là gì không? Theo Porway, thành phần bí mật là tư duy phản biện.

"Nó thực sự làm nổi bật các tin tặc khỏi các nhà khoa học thực sự, đối với tôi," Porway nói. "Bạn sẽ ngạc nhiên về số lần tôi thấy ai đó xây dựng mô hình và báo cáo kết quả mà không nhận ra rằng họ đã không suy nghĩ nghiêm túc về việc dữ liệu đến từ đâu hoặc nếu thử nghiệm của họ được thiết kế chính xác. Bạn phải có thể đặt câu hỏi cho từng bước về quá trình của bạn và mọi con số mà bạn nghĩ ra. "

Đường đến dữ liệu lớn

Porway cho biết khi anh nhận ra khả năng sử dụng lượng dữ liệu khổng lồ để có máy móc tự dạy, nó đã thổi vào tâm trí anh. Đó là niềm đam mê - và giáo dục và kỹ năng của anh ấy - đã giúp anh ấy có được một công việc hàng đầu trong khoa học dữ liệu. Nếu bạn muốn khuấy động dữ liệu lớn, hãy đọc một số sách, tải xuống một số dữ liệu và bắt đầu chơi xung quanh. Bạn không bao giờ biết những gì một đống dữ liệu thô sẽ xuất hiện.

Để có bản sao đầy đủ của cuộc phỏng vấn, hãy truy cập DataSellectists.Net.