Làm thế nào để nuôi dưỡng một nhà khoa học dữ liệu

Tác Giả: Judy Howell
Ngày Sáng TạO: 26 Tháng BảY 2021
CậP NhậT Ngày Tháng: 21 Tháng Sáu 2024
Anonim
Làm thế nào để nuôi dưỡng một nhà khoa học dữ liệu - Công Nghệ
Làm thế nào để nuôi dưỡng một nhà khoa học dữ liệu - Công Nghệ

NộI Dung


Lấy đi:

Để nuôi dưỡng các nhà khoa học dữ liệu, các công ty cần tập trung nhiều hơn vào văn hóa và cấu trúc tổ chức.

Trong số các công ty khởi nghiệp công nghệ, nhà khoa học dữ liệu là một thuật ngữ ngày càng phổ biến được sử dụng để chỉ những người đam mê dữ liệu có thể kết nối các khu vực chức năng thông minh dữ liệu theo truyền thống. Một nhà khoa học dữ liệu là người thoải mái thực hiện một số khía cạnh (nếu không phải tất cả) của các dự án thông minh dữ liệu:

  1. Thu thập dữ liệu: Điều này có thể đòi hỏi phải viết trình phân tích cú pháp tùy chỉnh và trình thu thập dữ liệu web hoặc tập lệnh nhắm mục tiêu các dịch vụ web hoặc API cụ thể cho các nguồn dữ liệu phi truyền thống.
  2. Quản lý dữ liệu: ETL, thao tác, truy vấn và duy trì dữ liệu trong cơ sở dữ liệu, kho lưu trữ khóa-giá trị hoặc Hadoop.
  3. Trực quan hóa thông tin: Khám phá các mẫu thông qua việc sử dụng các bộ công cụ trực quan tĩnh và / hoặc các nền tảng tương tác dựa trên Flash, JavaScript hoặc Xử lý.
  4. Phân tích: Điều này có thể bao gồm từ các kỹ thuật đơn giản đến phức tạp trong thống kê đa biến, học máy và NLP.
  5. Insight: Trích xuất, tóm tắt và trình bày những phát hiện quan trọng cho nhiều đối tượng.

Có nhiều công cụ, kỹ năng và chi tiết kỹ thuật, và người ta có thể dành nhiều năm để làm chủ từng mục được liệt kê ở trên. Mặc dù một nhà khoa học dữ liệu có thể không có kiến ​​thức chuyên môn thực sự trong bất kỳ lĩnh vực nào, anh ta hoặc cô ta thoải mái bỏ qua lại và thực hiện các nhiệm vụ cơ bản trong tất cả chúng. Kết quả là một người đam mê dữ liệu đủ nhanh nhẹn để nhanh chóng điều tra một dự án dữ liệu và đưa ra câu trả lời cho các câu hỏi (cấp cao) từ ban quản lý. (Đọc thêm về các nhà khoa học dữ liệu trong các nhà khoa học dữ liệu: Những ngôi sao nhạc rock mới của thế giới công nghệ.)


Để nuôi dưỡng các nhà khoa học dữ liệu, các công ty cần tập trung nhiều hơn vào văn hóa và cấu trúc tổ chức. Nhiều nhân viên dữ liệu có đủ kỹ năng và đào tạo để nhanh chóng làm việc hiệu quả trong nhiều lĩnh vực thông minh dữ liệu. Vấn đề là hầu hết không hoạt động trong môi trường khuyến khích họ trở thành nhà khoa học dữ liệu. Họ bị mắc kẹt trong các silo và giới hạn trong một hoặc hai lĩnh vực thông minh dữ liệu. Thông thường, họ bị hạn chế sử dụng các công cụ "được phê duyệt" bởi người quản lý của họ.

Sau khi làm việc trong các công ty cả lớn và nhỏ, tôi thấy rõ ràng rằng sự phân tách nhiệm vụ nghiêm ngặt là trở ngại lớn mà các nhà khoa học dữ liệu phải đối mặt. Biểu hiện phổ biến nhất là sự tách biệt giữa phân tích dữ liệu và quản lý dữ liệu. Trong nhiều công ty lớn, hầu hết các nhà phân tích / thống kê phải chờ dữ liệu từ một nhóm lưu trữ dữ liệu được chỉ định và trong nhiều trường hợp họ chờ dữ liệu từ nhiều chủ sở hữu của các kho dữ liệu khác nhau.


Cách khuyến khích khoa học dữ liệu trong một tổ chức

Hiện tại, các nhà khoa học dữ liệu phát triển mạnh trong các công ty khởi nghiệp nhỏ hơn, các công ty internet và các tổ chức khác, nơi ít chú trọng đến các vai trò và nhiệm vụ được xác định. Nhưng thực sự không có lý do tại sao các tổ chức lớn và trưởng thành không thể tham gia vui vẻ. (Không có lý do tại sao các nhà thống kê của bạn không thể học cách viết các trang web đơn giản và tại sao cơ sở dữ liệu của bạn không thể tìm hiểu các số liệu thống kê và trực quan đơn giản.) Dưới đây là một số gợi ý về cách thực hiện:

Khi bạn cam kết thành lập một nhóm các nhà khoa học dữ liệu, bạn có thể bắt đầu bằng cách xác định các nhân viên hiện tại có thể phù hợp với hồ sơ. Họ phải có tư duy cởi mở, định hướng theo nhóm và có một số kỹ năng lập trình trong một trong những lĩnh vực được mô tả ở trên. Lý tưởng nhất là bạn sẽ có sự kết hợp của những người từ khoa học máy tính, số liệu thống kê / định lượng hoặc định hướng dữ liệu. Các thành viên trong nhóm cần sẵn sàng chia sẻ các công cụ đơn giản, hack và kỹ thuật với nhau. Sự thụ tinh chéo sẽ diễn ra một cách tự nhiên nếu các thành viên trong nhóm hào hứng học hỏi lẫn nhau. Những nhân viên không muốn chia sẻ các kỹ thuật, công cụ và ý tưởng sẽ cản trở tiến trình.

Bạn không thể cải thiện kỹ năng lập trình của mình khi không ai quan tâm đến chất lượng phần mềm.

Khi các nhà quản lý nhận được thông báo rằng một nhóm chơi với các nguồn dữ liệu mới, họ có thể cố gắng đưa ra các trở ngại ("Còn về tính toàn vẹn dữ liệu? Họ không sử dụng các kỹ thuật thống kê / học máy đúng cách! Thiết kế thử nghiệm sai! kết hợp điều đó với dữ liệu của chúng tôi? "). Nếu không có sự hỗ trợ chính trị, nhóm các nhà khoa học dữ liệu của bạn sẽ gặp phải đám cháy (không) thân thiện. Những điều mới có xu hướng được coi là mối đe dọa, vì vậy tốt nhất nên trấn an các nhà quản lý một cách nhanh chóng rằng các nhà khoa học dữ liệu bổ sung cho những gì họ làm. Thông tin chi tiết được phát hiện bởi nhóm các nhà khoa học dữ liệu nhỏ của bạn có thể được sử dụng để thông báo cho các dự án dữ liệu / phân tích chính thức hơn. Các nhà khoa học dữ liệu sẽ không loại bỏ sự cần thiết của các nhà thống kê, nhưng họ có thể hướng chúng đến các bộ dữ liệu và câu hỏi khác nhau.

Sử dụng nhóm các nhà khoa học dữ liệu ban đầu của bạn làm nhà truyền giáo

Nếu bạn chọn nhóm các nhà khoa học dữ liệu ban đầu của mình một cách chính xác, họ sẽ cảm thấy thoải mái khi trình bày những phát hiện của họ cho những người khác trong công ty của bạn. Tốt hơn nữa, họ sẽ nhiệt tình về nó! Sử dụng chúng để tác động đến cách phần còn lại của công ty xem thông tin dữ liệu và từ từ hạ gục các silo đó.

Tôi không nói rằng các công cụ đào tạo và doanh nghiệp mới cuối cùng sẽ không cần thiết khi bạn thành lập nhóm các nhà khoa học dữ liệu nội bộ. Nhưng tôi nghĩ rằng bằng cách giải quyết các cấu trúc văn hóa và tổ chức, nhiều công ty có thể sử dụng nhân viên của mình cùng với các công cụ miễn phí, để tạo ra một nhóm nhỏ các nhà khoa học dữ liệu. Tôi nói từ kinh nghiệm, đã từng làm việc cho các công ty lớn - tài năng ở đó và các kỹ thuật không khó học, nhưng các silo tổ chức rất khó để vượt qua. Hàng ngũ của họ đã bao gồm một nhóm tài năng sẵn sàng tỏa sáng, nếu không phải vì các cấu trúc doanh nghiệp cứng nhắc làm hạn chế những gì họ có thể làm.


Tái xuất bản với sự cho phép từ http://prrealquant.blogspot.ca và Ben Lorica. Bài viết gốc có thể được tìm thấy ở đây: http://prrealquant.blogspot.ca/2010/07/how-to-nurture-data-scientists.html