12 lời khuyên chính cho việc học khoa học dữ liệu

Tác Giả: Laura McKinney
Ngày Sáng TạO: 3 Tháng Tư 2021
CậP NhậT Ngày Tháng: 1 Tháng BảY 2024
Anonim
12 lời khuyên chính cho việc học khoa học dữ liệu - Công Nghệ
12 lời khuyên chính cho việc học khoa học dữ liệu - Công Nghệ

NộI Dung


Nguồn: Artinspires / Dreamstime.com

Lấy đi:

Các nhà khoa học dữ liệu rõ ràng cần các kỹ năng toán học và mã hóa mạnh mẽ, nhưng giao tiếp và các kỹ năng mềm khác cũng rất cần thiết để thành công.

Nhà khoa học dữ liệu được xếp hạng là công việc tốt nhất cho năm 2019 ở Mỹ trên Glassdoor. Với mức lương cơ bản trung bình là 108.000 đô la và mức độ hài lòng công việc là 4,3 trên 5, cộng với một số lượng công bằng được dự đoán, điều đó không đáng ngạc nhiên. Câu hỏi là: Người ta phải làm gì để đi đúng hướng để đủ điều kiện cho công việc này?

Để tìm hiểu, chúng tôi đã tìm kiếm lời khuyên cho những người tìm cách theo dõi sự nghiệp này. Phần lớn đến từ các kỹ năng cứng về mã hóa và toán học. Nhưng sự tính toán mạnh mẽ đó không thôi. Các nhà khoa học dữ liệu thành công cũng cần có khả năng nói chuyện với các doanh nhân theo cách riêng của họ, điều này đòi hỏi các khả năng liên quan đến kỹ năng mềm và khả năng lãnh đạo. (Để tìm hiểu thêm về nhiệm vụ của nhà khoa học dữ liệu, hãy xem Vai trò công việc: Nhà khoa học dữ liệu.)


Xây dựng nền tảng giáo dục: Ba lời khuyên chính

Drace Zhan, một nhà khoa học dữ liệu tại Học viện Khoa học Dữ liệu NYC, nhấn mạnh sự cần thiết của một nền tảng giáo dục bao gồm các yếu tố cần thiết của khả năng mã hóa và toán học:

  1. R / Python + SQL. Nếu bạn không có kỹ năng mã hóa, bạn cần rất nhiều sức mạnh mạng và các lĩnh vực khác để tăng cường thâm hụt này. Tôi đã thấy các nhà khoa học dữ liệu có toán học yếu và ít kinh nghiệm về miền nhưng họ luôn luôn có khả năng mã hóa mạnh mẽ. Python là lý tưởng nhưng R là một công cụ trở lại tuyệt vời. Nó tốt nhất để có cả trong kho vũ khí của bạn. SQL cũng cực kỳ quan trọng đối với một Nhà phân tích dữ liệu.

  2. Kỹ năng toán học mạnh. Hiểu rất rõ về một vài phương pháp thường được sử dụng: mô hình tuyến tính tổng quát, cây quyết định, phương tiện K và kiểm tra thống kê tốt hơn là có một bức tranh rộng lớn về các mô hình hoặc chuyên môn hóa khác nhau như RNN.

Đó là những kỹ năng trung tâm để xây dựng, mặc dù một số chuyên gia thêm vào chúng. Ví dụ, danh sách KDnuggets bao gồm các thành phần mã hóa mà Zhan đã đề cập và thêm vào một số điều hữu ích khác cần biết về mặt kỹ thuật, bao gồm nền tảng Hadoop Apache Spark, trực quan hóa dữ liệu, dữ liệu phi cấu trúc, học máy và AI.


Nhưng nếu chúng ta lấy tín hiệu từ một cuộc khảo sát về các công cụ được sử dụng phổ biến nhất được xác định để sử dụng trong cuộc sống thực bằng một cuộc khảo sát Kaggle, chúng ta sẽ nhận được một số kết quả khác nhau. Như bạn có thể thấy từ biểu đồ của 15 lựa chọn hàng đầu dưới đây, Python, R và SQL dễ dàng tạo ra ba lựa chọn hàng đầu, nhưng thứ tư là máy tính xách tay Jupyter, tiếp theo là TensorFlow, Amazon Web Services, Unix shell, Tableau, C / C ++, NoQuery , MATLAB / Octave và Java, tất cả trước Hadoop và Spark. Một bổ sung nữa có thể làm mọi người ngạc nhiên, đó là Khai thác dữ liệu Microsoft Excel Excel.

Hình ảnh lịch sự của Kaggle

Danh sách KDnuggets cũng bao gồm một mẹo liên quan đến giáo dục chính thức. Hầu hết các nhà khoa học dữ liệu có bằng cấp cao: 46% có bằng tiến sĩ và 88% có ít nhất một bằng cấp bậc thầy. Bằng đại học mà họ sở hữu thường được phân chia giữa các lĩnh vực liên quan. Khoảng một phần ba là trong toán học và thống kê, đó là phổ biến nhất cho theo dõi nghề nghiệp này. Phổ biến nhất tiếp theo là bằng khoa học máy tính, được tổ chức bởi 19 phần trăm và kỹ thuật, sự lựa chọn là 16 phần trăm. Tất nhiên, các công cụ kỹ thuật dành riêng cho khoa học dữ liệu thường không được nghiên cứu trong các chương trình cấp bằng mà tại các trại khởi động chuyên ngành hoặc thông qua các khóa học trực tuyến.

Nhiều hơn các khóa học: Hai lời khuyên khác

Hank Yun, trợ lý nghiên cứu của Khoa Phổi tại Weill Cornell Medicine và sinh viên Học viện Khoa học Dữ liệu NYC, khuyên các nhà khoa học dữ liệu có kế hoạch xung quanh những gì họ sẽ làm việc và tìm một người cố vấn. Anh nói:

Không lỗi, không căng thẳng - Hướng dẫn từng bước của bạn để tạo ra phần mềm thay đổi cuộc sống mà không phá hủy cuộc sống của bạn

Bạn không thể cải thiện kỹ năng lập trình của mình khi không ai quan tâm đến chất lượng phần mềm.

Donith đã phạm sai lầm mà tôi đã gây ra bằng cách nói với bản thân rằng bạn biết khoa học dữ liệu vì bạn đã tham gia một khóa học và nhận được chứng chỉ. Đó là một khởi đầu tuyệt vời, nhưng khi bạn bắt đầu học, hãy nghĩ đến một dự án. Sau đó tìm một người cố vấn trong lĩnh vực này và bắt đầu một dự án đam mê ngay lập tức! Khi bạn còn tươi, bạn không biết những gì bạn không biết, vì vậy sẽ có ích khi ai đó ở đó để hướng dẫn bạn những gì quan trọng đối với bạn và những gì không. Bạn không muốn dành nhiều thời gian để học mà không có gì để thể hiện!

Biết công cụ nào để lấy ra khỏi hộp công cụ của bạn: Mẹo để luôn đi trước đường cong

Với sự chênh lệch trong bảng xếp hạng các công cụ khoa học dữ liệu, một số người có thể cảm thấy hoang mang về những gì cần tập trung vào. Celeste Fralick, nhà khoa học dữ liệu tại công ty phần mềm bảo mật McAfee, đã giải quyết vấn đề này trong một bài báo của CIO xem xét các kỹ năng cần thiết cho một nhà khoa học dữ liệu, tuyên bố, Nhà khoa học dữ liệu cần phải đứng trước nghiên cứu, cũng như hiểu được công nghệ nào sẽ được áp dụng khi nào. Điều đó có nghĩa là không bị dụ dỗ bởi sự gợi cảm và mới mẻ, khi vấn đề thực tế, đòi hỏi một thứ gì đó khác thường hơn. Nhận thức về chi phí tính toán cho hệ sinh thái, tính dễ hiểu, độ trễ, băng thông và các điều kiện biên hệ thống khác - cũng như sự trưởng thành của khách hàng - chính nó giúp nhà khoa học dữ liệu hiểu được công nghệ nào sẽ áp dụng.

Kỹ năng mềm cần thiết: Sáu lời khuyên khác

Điểm Fralick đưa ra liên quan đến các kỹ năng phi kỹ thuật mà công việc nhà khoa học dữ liệu yêu cầu. Đó là lý do tại sao danh sách KDnuggets bao gồm bốn: sự tò mò trí tuệ, tinh thần đồng đội, kỹ năng giao tiếp và sự nhạy bén trong kinh doanh. Zhan cũng bao gồm các kỹ năng mềm quan trọng trong lời khuyên của mình dành cho các nhà khoa học dữ liệu, xác định các kỹ năng giao tiếp của YouTube, giống như KDnuggets, nhưng sử dụng chuyên môn về miền miền Thay vì sự nhạy bén trong kinh doanh. kinh doanh. (Để tìm hiểu thêm về kỹ năng giao tiếp, hãy xem Tầm quan trọng của Kỹ năng giao tiếp dành cho Chuyên gia Kỹ thuật.)

Olivia Parr-Rud đã đưa ra guồng quay của riêng mình về điều này, thêm hai kỹ năng mềm nữa, nhấn mạnh vào vai trò của sự sáng tạo, khẳng định, tôi nghĩ về khoa học dữ liệu như một môn nghệ thuật, một thứ gì đó đòi hỏi phải vẽ những điểm mạnh của cả hai bên não. Nhiều người nói về khoa học dữ liệu như một nghề nghiệp chủ yếu sử dụng não trái. Tôi đã thấy rằng để thành công, các nhà khoa học dữ liệu phải sử dụng toàn bộ não của họ.

Bà giải thích rằng tiến bộ trong lĩnh vực không chỉ đòi hỏi năng lực kỹ thuật mà cả sự sáng tạo và tầm nhìn cần thiết cho lãnh đạo:

Hầu hết các nhiệm vụ não trái / tuyến tính có thể được tự động hóa hoặc có nguồn gốc. Để cung cấp một lợi thế cạnh tranh như các nhà khoa học dữ liệu, chúng ta phải có khả năng nhận ra các mẫu và tổng hợp số lượng lớn thông tin bằng cách sử dụng cả hai mặt của bộ não. Và chúng ta phải là những nhà tư tưởng đổi mới. Nhiều kết quả tốt nhất là kết quả của sự tích hợp của não trái và não phải.

Cô cũng nhấn mạnh tại sao truyền đạt một tầm nhìn rõ ràng là điều cần thiết:

Là nhà khoa học dữ liệu, mục tiêu của chúng tôi là sử dụng dữ liệu để giúp khách hàng tăng lợi nhuận. Hầu hết các giám đốc điều hành donith hiểu những gì chúng tôi làm hoặc cách chúng tôi làm điều đó. Vì vậy, chúng ta cần suy nghĩ như các nhà lãnh đạo và truyền đạt những phát hiện và khuyến nghị của chúng tôi bằng ngôn ngữ mà các bên liên quan của chúng tôi hiểu và tin tưởng.

Dữ liệu Dozen

Các mẹo chính kết hợp một số lượng lớn hơn các công cụ kỹ năng, kỹ năng và khả năng, cũng như các phẩm chất ít định lượng hơn như năng khiếu sáng tạo và lãnh đạo. Cuối cùng, nó không chỉ là một trò chơi số. Vì khoa học dữ liệu không chỉ là tạo ra các mô hình trong chân không mà còn đưa ra các ứng dụng thực tế để giải quyết các vấn đề thực tế cho doanh nghiệp, những người sẽ thành công trong lĩnh vực này không chỉ cần làm chủ công nghệ mà còn phải biết lĩnh vực kinh doanh của họ và hiểu nhu cầu của các thành viên khác nhau của nhóm làm việc.