Nối tiếp bài viết về quá trình mình chuyển ngành, bài này sẽ nói về việc muốn làm Data nhưng chưa biết bắt đầu từ đâu? Bắt đầu thế nào? Mình đã trải qua những sự khó khăn đó và xin chia sẻ lại chút kinh nghiệm cho ai có ý định dấn thân vào ngành học thú vị này.
Trước khi đi vào cách mình học, mình muốn đề cập đến background của cá nhân mình tí. Mỗi người có mỗi xuất phát điểm khác nhau nên công thức dưới đây của mình sẽ không thể đúng với tất cả, nên tham khảo để điều chỉnh hướng đi thôi. Và cũng đừng lấy tốc độ học của ai đó trên mạng làm tiêu chuẩn, gây áp lực cho bản thân. Học chậm tí mà nó thấm thì tốt hơn.
Mình tốt nghiệp Cử Nhân Khoa Học ngành Quản trị kinh doanh Toàn Cầu của Troy University. Ở Đại học thì mình học về: Phân tích và Quản lý kinh doanh, Kinh Tế học, Xác xuất thống kê, Quản trị, Kế toán, Marketing,..etc. Và đặc biệt là Machine Learning
Nghe ảo quá đúng không. Quản trị kinh doanh mà đi dạy Machine learning 😄 Ở đại học, bọn mình được dạy về ML để có thể ứng dụng các dịch vụ như Microsoft AzureML Studio hay AWS SageMaker. Các dịch vụ Machine Learning này được Microsoft / Amazon setup sẵn hết rồi, không cần biết code vẫn xài được. Quan trọng là phải biết cách chọn thuật toán và tỉnh chỉnh để đạt hiệu quả cao.
Background của mình
Trước khi đi vào cách mình học, mình muốn đề cập đến background của cá nhân mình tí. Mỗi người có mỗi xuất phát điểm khác nhau nên công thức dưới đây của mình sẽ không thể đúng với tất cả, nên tham khảo để điều chỉnh hướng đi thôi. Và cũng đừng lấy tốc độ học của ai đó trên mạng làm tiêu chuẩn, gây áp lực cho bản thân. Học chậm tí mà nó thấm thì tốt hơn.
Mình tốt nghiệp Cử Nhân Khoa Học ngành Quản trị kinh doanh Toàn Cầu của Troy University. Ở Đại học thì mình học về: Phân tích và Quản lý kinh doanh, Kinh Tế học, Xác xuất thống kê, Quản trị, Kế toán, Marketing,..etc. Và đặc biệt là Machine Learning
Nghe ảo quá đúng không. Quản trị kinh doanh mà đi dạy Machine learning 😄 Ở đại học, bọn mình được dạy về ML để có thể ứng dụng các dịch vụ như Microsoft AzureML Studio hay AWS SageMaker. Các dịch vụ Machine Learning này được Microsoft / Amazon setup sẵn hết rồi, không cần biết code vẫn xài được. Quan trọng là phải biết cách chọn thuật toán và tỉnh chỉnh để đạt hiệu quả cao.
Quảng cáo
Mục đích là dùng các tool này để forecast, dự đoán các chỉ số như Revenue, Customer Churn rate, Delivery Time,… hoặc thực hiện các task phân loại (classification) hay clustering trong marketing, hoặc đơn giản là tự động hoá một vài tác vụ trong kinh doanh.

Sinh viên được tự pick vài course về Information System.
Với background đó gần 4 năm mình mở công ty riêng kinh doanh ở lĩnh vực sản xuất và bán lẻ. Mình tự setup website bán hàng, setup web-base ERP (đồ Wordpress mua về sửa lại thôi, không có gì thần thánh 😄), thiết kế hệ thống integration để đổ data từ các kênh e-com về. Xuất excel để phân tích và làm báo cáo. Các máy móc trong xưởng mình cũng tìm cách quản lý bằng spreadsheet và kỹ thuật Statistical Process Control.
=> Mình có nền tảng về kinh doanh và giải quyết các vấn đề kinh doanh, ở mức độ non-code (thuần kinh doanh). Mình chỉ thiếu kiến thức ở các tool hay dùng trong data.
Mình đi học code
Công thức của Data Analyst rất đơn giản: Data skill toán (không cao siêu như toán cao cấp đâu) Domain knowledge. Bạn nào mạnh về kinh doanh hoặc kiến thức về ngành bạn sắp làm data thì coi như là có ưu thế rồi.
Quá trình mình học Data của mình thế này:
Học trên CodeCademy: Cái này là do không có ai định hướng nên học đại, toàn ở beginner - intermediate level
- Python programming (OOP, lambda function, A/B testing with SciPy…)
- SQL
- HTML CSS (mấy cái này thực ra hồi xưa có biết rồi, học lại thôi)
- JS framework Flask, VUE, Bootstrap (beginner)
Học Data Science ở DataCamp => Thất bại
Đầu tháng 5, mình đăng ký tài khoản DataCamp để mình học (tại vì nó rẻ và thiên hướng data hơn). DataCamp là một nơi rất tốt để bổ sung technical skill, trải nghiệm hand-on, cầm tay chỉ việc là rất tuyệt vời. Nói rút gọn thì Datacamp sẽ giúp bạn trả lời câu hỏi "Tôi phải xử lý vấn đề này thế nào". Tuy nhiên họ quá tập trung vào tech, không giải thích ý nghĩa, làm cho người mới học trở nên mơ hồ.
Quảng cáo
Chính vì nó mơ hồ nên mình không hiểu được bức tranh toàn cảnh => Không đạt mục tiêu

Khoá Data Scientist của DataCamp
Những thứ mình học
- Python programming (học lại cho nó thấm)
- Pandas Numpy
- Matplotlib Seaborn
- PostgreSQL
- Tableau (lúc trước có dùng rồi mà sau này mới học sâu hơn)
- Exploratory Data Analysis (Read, clean, validate, distribution, multivariate relationship, …)
- Statistic in Python
- Scipy
- Scikit-learn
- Hypothesis testing
- Unsupervised, supervised, reinforcement learning, clustering,..
Đây là những gì DataCamp yêu cầu

Quảng cáo
Học các chứng chỉ của Google Data Analytics trên Coursera
Mãi đến cuối tháng 7, xin được cái học bổng của Google để học toàn bộ khoá học của họ trên Coursera. Khoá học này thì quá cơ bản, chỉ là giới thiệu chung chung. Nhưng nhờ khoá học này mà mình kết nối được các mảnh ghép rời rạc của bức tranh. Nó giúp mình trả lời được câu hỏi "Tại sao tôi phải làm vậy? Tại sao loài người lại nghĩ ra thứ này, và vì sao họ dùng nó trong những trường hợp này"
Khoá học này thì mình học khoảng 4 ngày là xong (thấy Google ghi là học cỡ 6 tháng 😁 nhưng tôi đã quá đau khổ với DataCamp rồi, dăm ba khoá học này ăn nhằm gì)
Trở lại học Datacamp
Sau khi đã có câu trả lời cho câu hỏi "Tại sao tôi phải làm vậy", mình kết hợp với "Tôi phải xử lý vấn đề này thế nào" => Mình trở lại lấy professional certificate của Datacamp, nhưng là Data Analyst thôi. Mình biết là mình còn thiếu quá nhiều kiến thức để thi Data Scientist nên mình vẫn đang học tiếp.
Đây là những gì bạn phải đạt khi muốn thành Certified Data Analyst của DataCamp

Những thứ mình tự học thêm
- PowerBI: Sau khi nhận ra là tableau quá đắt và lạc quẻ cho các công ty Châu Á, mình bắt đầu nạp thêm kiến thức về PowerBI, Dax function
- IT infrastructure: Phần này thì mình học khoá IT Support của Google và Computer Science for Business Professional của Harvard. Nghe thì có vẻ không liên quan nhưng nó đã giúp mình rất nhiều trong việc học và giao tiếp với các tech stack của data engineer.
- AWS S3, Lambda: Tự học để viết API, dùng API đi crawl data
- Selenium: Tất nhiên là để crawl data từ những nơi không có API rồi.
- Những món của Data Engineer: AWS Redshift, Athena, Glue, Azure Synapse,… hay các công nghệ như OLAP, các tool ETL: Công ty đào tạo hoặc mình vác máy qua nhờ các bạn DE chỉ cho. Nếu bạn hiểu về hạ tầng mạng thì tiếp thu những thứ này sẽ nhanh hơn tí
Những thứ mình đang học:
- DP-100: Designing and Implementing a Data Science Solution on Azure
- TensorFlow Keras (đang học trên Datacamp và Google)
Nếu được quay lại 5 tháng trước thì mình sẽ học Data Analyst theo lộ trình này
- Học chứng chỉ của Google để đặt nền tảng kiến thước trước => Google Data Analytics Professional Certificate
- Học track Data Analyst của DataCamp, tập trung SQl và PowerBI => lấy chứng chỉ DataCamp Data Analyst Associate => Bắt đầu đi Apply intern hoặc các job thiên về reporting
- Học nâng cao Python, EDA, hypothesis testing,… => lấy chứng chỉ Datacamp Data Analyst Professional
- Học các công cụ của Azure, AWS
Chọn project để làm portfolio thế nào?
Theo mình một project thành công nên có đủ các skill cần dùng trong công việc thực tế
- Tìm data source
- Dùng API để lấy data, hoặc scrape data về (Selenium hoặc scrappy,…), vì thực tế ngoài đời toàn làm thế.
- Nếu có sẵn một cái SQL server để login vào thực hành thì quá tốt.
- Phân tích Data, EDA, Validation
- Model fitting Evaluation (cho các data Science project)
- Visualization
- Insight recommendations
- Nếu project có thể tự động update, refresh data thì càng tốt
Minh thì chia nhỏ các yêu cầu này ra thành các project khác nhau.
- Mỗi loại data thường có 1 vấn đề riêng mà chúng ta có thể tận dụng 1 công nghệ để giải quyết, show-off kỹ năng.
- Nếu bạn dùng data có sẵn rồi Visualize bằng PowerBI hoặc Tableau cũng được, dùng SQL pull data về cũng được.
- Tuỳ công ty mà họ sẽ thấy kỹ năng của bạn phù hợp hay không để tuyển
- Đừng dùng các dataset quá cũ và nổi tiếng như Titanic nữa. Nó không thực tế và data đó cũng quá đẹp.
Những thủ thuật để việc học tốt hơn:
- Bí cái gì thì cứ lên Google mà tìm đọc lý thuyết.
- Microsoft, Google, Amazon Web Service có đầy đủ các tài liệu hướng dẫn, giải thích rất hay về Data, Machine learning. Họ cung cấp hoàn toàn miễn phí.
- Bí code thì cứ StackOverflow mà chiến
- Một trong những nơi học tốt nhất, đó là đi phỏng vấn. Khi đi phỏng vấn, người ta sẽ gởi cho bạn các bài screening test, bạn sẽ có những cái nhìn rõ hơn về việc người ta tét cái gì và bạn đáp ứng được gì.
- Nếu đọc lý thuyết mà không hiểu thì lên Youtube coi các chuyên gia giải thích kỹ hơn. Có rất nhiều kênh YouTube giải thích 5 phút bằng mình tự đi tìm hiểu 50 phút.
- Các công cụ visualize code

Computer Science Circle của Waterloo University: https://cscircles.cemc.uwaterloo.ca có các tool visualize code rất hay

Computer Science Circles | 01000011 01010011 01000011
cscircles.cemc.uwaterloo.ca
Những nơi bạn có thể luyện SQL:
- Hackerrank
- Leetcode
- DataLemur
Những thắc mắc thường gặp khi học Data Analyst
- Bắt đầu từ đâu? ==> hãy tin mình, học khoá học của Google trước đi
- Quan trọng nhất là phải học Python??? ==> Python phổ biến vì nó làm được nhiều thứ, nhưng trong DA nó chưa chắc là thứ quan trọng nhất. Trong những công ty có tổ chức data hoàn chỉnh thì thường DA sẽ được tiếp cận với data ở Gold level, mọi thứ đã được các bạn Data Engineer clean và xử lý xong hết rồi (Cảm ơn các bạn DE rất nhiều 😁 ). Thứ quan trọng không kém mà một DA cần quan tâm là SQL. Bạn sẽ làm việc với SQL rất nhiều. Khi làm việc với các data lớn bạn sẽ phải dùng các tool SQL, ví dụ Spark SQL, AWS Redshift hay AWS Athena hay các SQL sever. Bạn phải lấy số liệu từ SQL rất nhiều. Các tool visualization cũng có cần SQL để lấy data về dựng chart.
- Tableau > PowerBI???? ==> Đúng, nhưng mà sai. Mình là fan ruột của Tableau vì nó nhanh hơn, tiện lợi hơn, thông minh hơn. Tuy nhiên tiền phí bản quyền Tableau khá là đắt. Nên nếu bạn nào muốn làm Data ở Việt Nam thì cân nhắc học PowerBI vì các doanh nghiệp thường không muốn bỏ tiền ra để mua Tableau đâu. Lý do nữa là hạ tầng Microsoft Office 365 được dùng ở rất nhiều doanh nghiệp nên Microsoft PowerBI mặc định sẽ được sử dụng cho nó tiện và tiết kiệm
- Học khoá học Google xong có đi làm được không? ==> Không thể
- Học Datacamp hay Dataquest.io => Mình không biết, nhưng danh tiếng datacamp thì lớn hơn, phổ biến hơn
- Trên Coursera, học khoá của Google hay IBM? => Mình học audit khoá của IBM thì thấy khoá của Google cung cấp kiến thức nền tảng tốt hơn, khoá của IBM thì thực hành tốt hơn. Nhưng phần thực hành thì mình học trên Datacamp rồi nên mình không bỏ tiền ra lấy cert của IBM nữa.
- Có cần làm website portfolio không? ==> Có nhé. Nên có. Dùng các dịch vụ có sẵn như Wix hay Wordpress.com cũng được. Tham khảo bài viết này: https://careerfoundry.com/en/blog/data-analytics/data-analytics-portfolio-examples/#claudia-ten-hoope
- Đi học trung tâm có được không? Mình không biết, tại vì mình tự học, không đi học trung tâm. Nhưng mình có tham khảo qua khoá học của vài trung tâm thấy cũng sát thực tế so với những gì mình dùng trong công việc. Nhưng có trung tâm thì bánh vẽ lắm. Giáo trình dạy Data Analyst từ còn số 0 mà vẽ qua hướng Machine learning rất nặng. Chả biết để làm gì.

9 Data Analytics Portfolio Examples [2022 Edition]
What should you include in your data analytics portfolio? Here are 9 awesome portfolio examples to inspire you.
careerfoundry.com
Học như vậy rồi có đi làm được không?
Câu trả lời ĐƯỢC, thậm chí là làm Tốt. Nhưng nó còn tuỳ.
- Tuỳ bạn học vẹt hay bạn học thật
- Tuỳ công việc bạn apply phức tạp đến cỡ nào
- Tuỳ năng lực tư duy của mỗi người.
- Tuỳ kinh nghiệm làm việc trước đây
- Tuỳ nền tảng kiến thức của mỗi người.
Lần trước mình có viết là mình học data trong 5 tháng là xin việc thành công. Nhiều bạn bảo là mình chém gió, làm sao mà học nhanh vậy được. Nên bài viết này cũng sẽ giải thích cho sự thắc mắc đó, hy vọng anh em vui vẻ đừng quạu quọ làm gì (mau già lắm).
Mình viết bài để chia sẻ và giúp đỡ những người đi sau khỏi gặp vấn đề như mình. Mấy anh Senior nếu có thấy gì không đồng tình thì hãy bớt tí thời gian viết bài chia sẻ và giúp đỡ những người mới, cho đàn em đi sau 😁
Ai thắc mắc gì cứ comment ở dưới nha. Mình biết thì mình trả lời. Không biết thì mình đi hỏi hộ cho :D
==***==
==***==
Nơi hội tụ Tinh Hoa Tri Thức - Khơi nguồn Sáng tạo
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
---
Khóa học Hacker và Marketing từ A-Z trên ZALO!
Khóa học Hacker và Marketing từ A-Z trên Facebook!
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP
Khóa học Lập trình Visual Foxpro 9 - Dành cho nhà quản lý và kế toán
Khóa học hướng dẫn về Moodle chuyên nghiệp và hay Xây dựng hệ thống đào tạo trực tuyến chuyên nghiệp tốt nhất hiện nay.
Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
Khóa học "Thiết kế bài giảng điện tử", Video, hoạt hình kiếm tiền Youtube bằng phần mềm Camtasia Studio Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công ==***== Bảo hiểm nhân thọ - Bảo vệ người trụ cột Cập nhật công nghệ từ Youtube tại link: congnghe.hocviendaotao.com
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Bảo mật và tấn công Website - Hacker mũ trắng
KHÓA HỌC LẬP TRÌNH PYTHON TỪ CƠ BẢN ĐẾN CHUYÊN NGHIỆP

Khóa học AutoIt dành cho dân IT và Marketing chuyên nghiệp
Khoá học Word từ cơ bản tới nâng cao, học nhanh, hiểu sâu
Khóa học hướng dẫn sử dụng Powerpoint từ đơn giản đến phức tạp HIỆU QUẢ
Khóa học Thiết kế, quản lý dữ liệu dự án chuyên nghiệp cho doanh nghiệp bằng Bizagi
Khóa học Phân tích dữ liệu sử dụng Power Query trong Excel
Khóa học Lập trình WEB bằng PHP từ cơ bản đến nâng cao
kiếm tiền Youtube bằng phần mềm Camtasia Studio
Khóa học HƯỚNG DẪN THIẾT KẾ VIDEO CLIP CHO DÂN MARKETING CHUYÊN NGHIỆP
HƯỚNG DẪN THIẾT KẾ QUẢNG CÁO VÀ ĐỒ HỌA CHUYÊN NGHIỆP VỚI CANVA
Hãy tham gia khóa học để trở thành người chuyên nghiệp. Tuyệt HAY!😲👍
GOOGLE SPREADSHEETS phê không tưởng
Hãy tham gia khóa học để biết mọi thứ
Khóa học sử dụng Adobe Presenter-Tạo bài giảng điện tử
Để thành thạo Wordpress bạn hãy tham gia khóa học
Khóa học sử dụng Edmodo để dạy và học hiện đại để thành công
==***==
Bảo hiểm nhân thọ - Bảo vệ người trụ cột
Tham gia nhóm Facebook
Để tham gia khóa học công nghệ truy cập link: http://thuvien.hocviendaotao.com
Mọi hỗ trợ về công nghệ email: dinhanhtuan68@gmail.com
Nguồn: Tinh Tế

Topics: Công nghệ mới