Публикация была переведена автоматически. Исходный язык: Английский
Для слушателей курса Big Data / Machine Learning Engineer (BDMLE) месяц назад наметилась развилка: больше погружаться в Big Data (BD) или Machine Learning (ML)?
Посовещались и решили с вами тоже поделиться лакмусовой бумажкой и информацией по стеку технологий. Надеемся, это знание упростит ваш выбор в преддверии нового раунда Tech Orda.
📜 лакмусовая бумажка: если вы любите больше программировать, чем выводить формулы и считать интегралы, то вам больше подойдет Big Data. В противном случае - ML.
Стек
Big Data: HDFS, Hadoop, Hive, Spark, Kafka + Spark Structured Streaming, NoSQL (Cassandra), Data Layout (Parquet, ORC, compression), плюшки Hadoop 3+.
Machine Learning (основные): numpy, scipy, pandas, sklearn, pytorch, xgboost / lightgbm / catboost.
Вы бы что выбрали?
🐳 Big Data
⚡️ Machine Learning
Пишите ответы в комментариях
❤️🔥 BD + ML, взболтать, но не смешивать
photo: Артем
#work #study
A month ago, there was a fork in the road for students of the Big Data / Machine Learning Engineer (BDMLE) course: should they immerse themselves more in Big Data (BD) or Machine Learning (ML)?
We conferred and decided to share with you a litmus test and information on the technology stack. Hopefully, this knowledge will simplify your choice ahead of the new Tech Orda round.
Litmus test: if you like programming more than deducing formulas and counting integrals, then Big Data is more suitable for you. Otherwise, ML.
Stack
Big Data: HDFS, Hadoop, Hive, Spark, Kafka + Spark Structured Streaming, NoSQL (Cassandra), Data Layout (Parquet, ORC, compression), Hadoop 3+ buns.
Machine Learning (basic): numpy, scipy, pandas, sklearn, pytorch, xgboost / lightgbm / catboost.
What would you choose?
🐳 Big Data
⚡️ Machine Learning
Write the answers in the comments
❤️ BD + ML, shake, but do not mix
photo: Artyom
#work #study