Header ads

Header ads
» »Unlabelled » Data Engineer nên là người xây dựng các công cụ data, chứ làm ETL hoài cũng chán

ETL là mình nói chung thôi, chứ thật ra thì cái mình nói đến là việc mantain tất cả những thể loại data pipeline trên đời này. Những việc đó nó sẽ bị lặp đi lặp lại, làm một thời gian sẽ chán, chưa kể nếu việc xây dựng và thêm, sửa các thành phần trong data pipeline chỉ nằm trong tay các ông data engineer thì nó sẽ tạo thành nút nghẽn cổ chai khiến việc bị chậm lại. Thế nên, theo mình, data engineer ngoài chuyện xây data pipeline thì còn phải xây cả các công cụ để mọi người trong công ty có thể truy cập, sử dụng data dễ dàng hơn.

Làm data pipeline hoài thì sẽ chán


Đương nhiên, có những thứ cứ lặp đi lặp lại mãi thì bạn sẽ không còn cảm thấy hứng thú để làm nó nữa, và với những ông engineer mà mình biết, rất hiếm người sẵn sàng chỉ ngồi một chỗ làm data pipeline vì như vậy bạn khó mà phát triển thêm, khó mà học thêm kiến thức mới. Nếu chỉ ngồi thêm, sửa, xóa data pipline thì bạn sẽ không còn thời gian để làm việc khác, không có thời gian tạo ra những sản phẩm hay ho hơn, giúp ích được cho nhiều người hơn, tiết kiệm được nhiều tiền hơn cho công ty hoặc giúp công ty kiếm thêm được tiền.

Data engineer trở thành nút nghẽn cổ chai


Nhu cầu thêm sửa xóa data pipeline theo mình thấy lại thường đến từ phía người dùng business, hoặc cụ thể hơn là từ các bạn data analyst, business analyst. Cũng đúng thôi, mỗi ngày họ được giao cho các bài toán, các câu hỏi khác nhau để trả lời và khả năng cao là họ sẽ nhận thấy một số bảng dữ liệu chưa được chuẩn bị sẵn, chưa được mang từ hệ thống nguồn lên, và thế là họ đi nhờ mấy anh em data engineer load dữ liệu.

Mọi chuyện sẽ không có gì nghiêm trọng nếu chỉ có 1-2 bạn business analyst trong một công ty chưa sử dụng dữ liệu nhiều. Nhưng khi tổ chức bắt đầu hiệu và vận dụng data nhiều hơn, có thêm nhiều analyst hơn, thì các yêu cầu load dữ liệu sẽ ngày càng nhiều tới một lúc nào đó đội data engineer sẽ trở thành nút nghẽn. Bạn phải giải quyết tuần tự các yêu cầu, bạn phải hẹn người này, dời deadline của người kia. Tất nhiên là để sắp xếp ổn thỏa thì vẫn được thôi, nhưng đáng ra chúng ta không nên để các bạn analyst hoặc các bạn business - những người dùng của chúng ta - chờ lâu như thế.

Quảng cáo



Thế nên trong quá trình làm việc của mình, để tự giải phóng bản thân khỏi sự chán và sự nghẽn cổ chai như đã nói ở trên, mình sẽ chọn cách làm ra những công cụ, những hệ thống có khả năng tự động hóa quá trình thêm sửa xóa data pipeline.

IMG_2297.JPG

Xây công cụ, xây cơ chế kiểm soát, và mở ra cho mọi người dùng


Tùy theo bộ công nghệ mà công ty đang dùng là gì mà bạn có thể chế thêm các tool tương ứng, ví dụ mình có một công cụ để các bạn analyst vào tự tạo các bảng tổng hợp của họ để truy xuất dữ liệu nhanh, gọn, rẻ hơn. Nó có chức năng hẹn giờ để tự động rút dữ liệu mới vào bảng, có một số khả năng tự phát hiện kiểu dữ liệu của từng field để gợi ý. Công cụ cũng sẽ tự động scan data warehouse để đưa vào chức năng ghi chú, bảng nào, cột nào có ý nghĩa ra sao, nó dùng để làm gì… Tất cả những thứ này có thể dễ dàng truy cập thông qua một giao diện web nội bộ.

Lợi ích của việc này đó là mình không còn phải ngồi làm các việc load data thủ công nữa, các bạn analyst cần gì thì có thể tự xử, việc của các bạn không bị kẹt ở mình, không phải chờ lâu, không phải phụ thuộc. Ngoài ra, việc này cũng tăng khả năng quản lý data pipeline, khúc nào bị lỗi thì dễ dàng truy hơn, và có thể xem trực tiếp từ giao diện nhanh gọn lẹ, tức là nó cũng giúp cho chính mình nữa chứ không chỉ cho người dùng của mình.

Tất nhiên, khi bạn mở cho các thành viên khác cùng tham gia xây dựng data pipeline với bạn, bạn sẽ cần một số cơ chế kiểm soát, phân quyền để đảm bảo chi phí không bị quá cao, quyền không bị bỏ lọt, data không bị lạm dụng… cái này thì tùy cơ chế, công cụ của công ty mà sẽ có những cách kiểm soát khác nhau, không có mẫu chung. Nhưng nói chung là phải có, chứ không tới một ngày đẹp trời tiền nó vọt lên gấp đôi thì thốn lắm nha anh em 😁 Việc giám sát ra sao, monitor từng người dùng như thế nào là thứ anh em cần nghĩ tới ngay từ khi bắt đầu xây dựng công cụ để có thể tích hợp tốt mặt kiểm soát vào công cụ của mình, tránh phải sửa quá nhiều sau khi đã hoàn thiện sản phẩm.

quan_ly_cost.jpg

Cần thêm kĩ năng gì cho việc xây dựng công cụ?


Kĩ năng, kiến thức và kinh nghiệm về data thì anh em đã có, nhưng anh em cần chuyển hóa, tích hợp những kiến thức này vào một sản phẩm để người ta dùng. Khi đó anh em sẽ cần biết một chút về UX và về sản phẩm để hiểu người ta sẽ dùng công cụ của anh em ra sao, anh em có thể giải quyết những "nỗi đau" nào trong hoàn cảnh hiện tại của công ty, và liệu nó có đáng công sức đầu tư bỏ ra hay không.

Quảng cáo



Sau đó, nếu anh em không có ai trợ giúp, khả năng cao là anh em sẽ phải tự mình build luôn cả web, app hoặc một cái gì đó mà anh em cho là cần và dễ dàng truy cập. Cũng có thể nó là chỉ là một file YAML để các bạn analyst định nghĩa nếu anh em không có khả năng làm thành giao diện đồ họa. Tuy nhiên, theo mình thì lỡ rồi thì làm tới luôn, nếu có được giao diện đồ họa thì tốt vì như vậy sẽ giảm công, giảm thời gian học cho các bạn analyst khi họ dùng công cụ của anh em.

Mình từng chia sẻ với anh em về những hiểu biết sản phẩm khi làm data engineer, bao gồm cả kiến thức về front end, backend, sản phẩm, người dùng, UX. Ở Việt Nam và ở những công ty không quá to, khả năng cao là anh em sẽ cần tự làm thì mới xong việc chứ không thể chờ người khác giúp mình. Anh em xem kĩ hơn trong bài bên dưới nha.

Lợi ích của việc làm Data mà hiểu về việc phát triển web, app và vận hành sản phẩm | Tinh tế

Anh em làm việc data, có thể là data analyst, data engineer hay data scientist thì rõ là hiểu nhiều về data, cách giải pháp, cách thức xử lý dữ liệu và những thứ chuyên môn của anh em.
tinhte.vn


Hi vọng những chia sẻ nhỏ xíu của mình sẽ giúp được anh em phần nào trong việc mà chúng ta làm thường ngày. Cảm ơn anh em, thấy hay nhớ cho mình xin 5 sao nha 😆

CHUYÊN MỤC NGHỆ THUẬT LÀM GIÀU BỀN VỮNG
Khóa học Machine Learning cơ bản- Khoa học dữ liệu - AI
==***==

Khoá học Quản trị Chiến lược Dành cho Lãnh đạo Doanh nghiệp

Nhấn vào đây để bắt đầu khóa học

==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
--- 

Khóa học Hacker và Marketing từ A-Z trên ZALO!

Khóa học Hacker và Marketing từ A-Z trên Facebook!

Khóa đào tạo Power BI phân tích báo cáo để bán hàng thành công

Bảo mật và tấn công Website - Hacker mũ trắng
Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán

Khóa học hướng dẫn về Moodle chuyên nghiệp và hay
Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.



Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp

Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu


Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khoa hoc hay
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel

Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao

Khóa học Phân tích dữ liệu sử dụng TableAU - Chìa khóa thành công!
Nhấn vào đây để bắt đầu khóa học


Khóa học Phân tích dữ liệu sử dụng SPSS - Chìa khóa thành công!


Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình 
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
Xây dựng website​​​​
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
Khoa hoc hay
MICROSOFT ACCESS



GOOGLE SPREADSHEETS phê không tưởng
Khoa hoc hay
Khóa hoc lập trình bằng Python tại đây

Hãy tham gia khóa học để biết mọi thứ

Để tham gia tất cả các bài học, Bạn nhấn vào đây 

Khóa học lập trình cho bé MSWLogo
Nhấn vào đây để bắt đầu học
Nhấn vào đây để bắt đầu học


Khóa học Ba, Mẹ và Bé - Cùng bé lập trình  TUYỆT VỜI

Khoa hoc hay

Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Khoa hoc hay
Design Website

Để thành thạo Wordpress bạn hãy tham gia khóa học 
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com

Nguồn: Tinh Tế

About Học viện đào tạo trực tuyến

Xinh chào bạn. Tôi là Đinh Anh Tuấn - Thạc sĩ CNTT. Email: dinhanhtuan68@gmail.com .
- Nhận đào tạo trực tuyến lập trình dành cho nhà quản lý, kế toán bằng Foxpro, Access 2010, Excel, Macro Excel, Macro Word, chứng chỉ MOS cao cấp, IC3, tiếng anh, phần mềm, phần cứng .
- Nhận thiết kế phần mềm quản lý, Web, Web ứng dụng, quản lý, bán hàng,... Nhận Thiết kế bài giảng điện tử, số hóa tài liệu...
HỌC VIỆN ĐÀO TẠO TRỰC TUYẾN:TẬN TÂM-CHẤT LƯỢNG.
«
Next
Bài đăng Mới hơn
»
Previous
Bài đăng Cũ hơn