Mọi người đang dần cảm thấy data engineering là một subset của software engineering và rất nhiều software engineer đang làm việc với data. Vai trò của dữ liệu trong ngành phần mềm ngày càng quan trọng, những nhánh chuyên môn làm việc với dữ liệu dần được phân biệt rõ ràng hơn. Vậy đâu là sự khác nhau giữa software engineer, data engineer và data scientist?

Bài báo cáo của LinkedIn chỉ ra những kĩ năng mà mỗi vai trò thường có. Nhìn vào biểu đồ bên dưới, bạn thấy bản thân nên gọi mình là software engineer, data scientist hay data engineer?

Software Engineer

Là người làm applications và systems. Là người tham gia vào mọi giai đoạn từ thiết kế, viết code đến testing và review. Vai trò này tạo ra sản phẩm (và sản phẩm đó tạo ra data). Software Engineer là tên gọi đầu tiên trong 3 khái niệm về những người làm về big data, và là những người xây dựng nên hệ thống phương pháp thực hiện và chức năng cho sau này.

Công việc của Software Engineer bao gồm:

  • Phát triển frontend & backend
  • Ứng dụng web
  • Ứng dụng mobile
  • Phát triển hệ điều hành
  • Thiết kế phần mềm

Data Engineer

Data Engineer là người xây dựng systems tổng hợp, lưu trữ và xuất dữ liệu từ một số app và system tạo ra bởi software engineers. Data engineer sở hữu những kỹ năng của software engineer, vì về bản chất 40% data engineer ban đầu là một software engineer, đây là một trong những hướng phát triển nghề nghiệp thường thấy.

Công việc của Data Engineer bao gồm:

  • Cấu trúc dữ liệu nâng cao
  • Điện toán phân tán (distributed computing)
  • Lập trình đồng thời (concurrent programming)
  • Kiến thức về một số công cụ mới: Hadoop, Spark, Kafka, Hive, v.v.
  • Tạo ETL/data pipelines

Data Scientist

Data Scientist là người tạo hệ thống phân tích trên toàn bộ data, đó có thể là mẫu phân tích 1 lần để team hiểu về hành vi người dùng, hoặc thuật toán machine learning để implement vào code base của software engineers và data engineers.

Công việc của vai trò này bao gồm:

  • Data modeling
  • Machine learning
  • Algorithms
  • Business Intelligence dashboards

Xu hướng Big Data tại Việt Nam sẽ còn thay đổi

Một số xu hướng cho thấy cấu trúc đội ngũ làm việc, cấu trúc dự liệu sẽ còn có nhiều thay đổi. Vào 07/1 sắp tới, GetLinks và cộng đồng Grokking Vietnam sẽ tổ chức sự kiện Grokking Data Demo Day. Bên cạnh phần trình bày của 2 big data project tốt nhất trong khoá học kéo dài 8 tuần của Grokking sẽ là buổi trao đổi và chia sẽ về “Cái nhìn tổng quan về Big Data và xu hướng phát triển năm 2017” cùng các data science experts tại TPHCM.

Xem chi tiết và đăng ký tham gia tại: http://bit.ly/GDDDBG

 

grokking-data

Nguồn: 101 Datascience Community


Bài viết liên quan:

Developer có tiềm năng rất lớn ở nước ngoài

Các codestyle gây tranh cãi trong lập trình

Trên đời chỉ có 5 loại developer, bạn thuộc loại nào?


GetLinks là công ty kết nối nhân sự công nghệ hoàn toàn miễn phí dành cho ứng viên là Developer, Designer và Digital Marketer (3Ds) đến với các công ty công nghệ khắp Châu Á. Sứ mệnh của GetLinks là giúp cho top 3% tài năng công nghệ tìm được công việc phù hợp khả năng và đam mê, nơi họ có thể phát huy hết khả năng và liên tục tiến bộ.