Иногда в поисках IT-направления, где реализоваться, соискатели сталкиваются с
такой профессией как «data scientist», тогда назревает резонный вопрос: кто это и
что он должен знать?
На этот и на другие вопросы, связанные с профессией «дата сайентист» мы
постараемся ответить в этой статье.
Data Scientist, кто это?
Data Scientist — это тот, кто является экспертом в аналитике данных. Помимо этого,
он должен обладать глубокими техническими знаниями для решения непростых
технических задач. Это и математики и компьютерные специалисты в одном лице,
задача которых работать и анализировать большое количество информации.
Ключевыми словами этой профессии являются:
- громадные объемы информации;
- полное отсутствие структуры в представленной информации.
Типичным примером такой работы является:
- обработка метеорологических данных за какой-нибудь большой период времени и выявление закономерности;
- обработка статистики запросов пользователей в поисковой системе;
- анализ результатов спортивных соревнований;
- работа с геномом различных микроорганизмов;
- и мн.др.
Обычно работа дата сайентист включает в себя математическую статистику и
машинное обучение. Такой специалист проводит глубокий анализ данных, находит
закономерности и составляет прогнозы, чтобы найти оптимальное решение к
поставленной задаче. А задачи бывают разные.
Не стоит путать data scientist и бизнес-аналитику. Это совершенно разные вещи,
хотя в обеих профессиях идет работа с огромным объемом информации. Разница
скрыта в конечных результатах, которые получают в этих сферах:
- Data Scientist — это тот, кто работает «для будущего», так как он находит в большом объеме информации закономерность и взаимосвязь, для того чтобы предугадать возможный результат, который может получиться в будущем. Он смотрит как решить поставленную задачу с технической стороны.
- Бизнес-аналитик сосредотачивается на финансовых показателях компании, а не на технической части разрешения поставленных задач. Например, он анализирует эффективность рекламной компании, количество продаж за определенный период и т. д. И получив подобную информацию, старается улучшить коммерческие показатели организации. Иногда, для своего анализа такой специалист может привлечь Data Scientist в помощь.
Полезен ли труд Data Scientist?
На самом деле с трудами этих специалистов мы сталкиваемся в каждый день, ведь
это:
- прогнозирование погоды;
- голосовой помощник;
- прогрессивный чат-бот;
- генная инженерия;
- представление возможных друзей в соцсетях;
- и др.
Полезен ли такой труд? Скорее всего да, чем нет. Кстати, у основания поисковых
алгоритмов и алгоритмов распознавания человеческого лица, тоже стоят
специалисты Big Data.
Где можно встретить Data Scientist?
Data Scientist — это тот, кто может работать в различных сферах. Хоть эта
профессия и имеет тесную связь с IT, но специалистов Big Data можно встретить где
угодно:
- В любом направлении бизнеса. Дата сайентист может создать алгоритм для
вычисления спроса на товар или услугу компании или же провести анализ: имеет и
смысл открывать новое направление в бизнесе или открывать бизнес в новом
регионе и т. д. - В банковской сфере. Тут такой специалист легко рассчитает платежеспособность
клиента и подскажет, можно ли ему выдавать кредит. - В логистике. Алгоритмы Big Data помогут рассчитать оптимальный маршрут и
способ доставки груза. - В IT-направлении. Data Scientist может разработать бота, поисковый алгоритм или
алгоритм машинного обучения. - В производственных предприятиях. Тут разрабатываются различные алгоритмы
вычисления необходимого количества производимой продукции, программы для
вычисления вероятности сбоя оборудования или появления дефекта в продукции. - В страховых организациях. Подобные программы вычисляют вероятности
возникновения страховых случаев. - В медицине. Автоматическое выставление диагноза на основании полученных
данных — это тоже алгоритмы Big Data. - В сельском хозяйстве. Прогноз возможного объема урожая и подбор оптимального
использования земли — это рабочая сфера Data Scientist. - В генной инженерии. Современные исследования в этой области просто не
мыслимы без обработки огромного объема информации. - В метеорологии. Мы уже затрагивали сегодня эту тему, прогноз погоды — это
результат деятельности дата сайентист.
И список можно продолжать и продолжать. Это и физические исследования, и
космос,и спорт, и мн.др. Везде, где нужно составить прогноз на основе большого
количества данных — это поле деятельности для Data Scientist.
Заработок Data Scientist
Это достаточно востребованная профессия с хорошим заработком. Открытые
вакансии по этой профессии найти не сложно, но нужно быть хорошим
профессионалом своего дела. Машинное обучение сейчас «впереди планеты всей»,
а обучающие алгоритмы для этого и есть непосредственное поле деятельности Data
Scientist.
Что там по зарплатам? Приведем среднестатистические цифры, потому что многое
определяет опыт специалиста, сфера работы и деятельность самой компании. На
первое полугодие 2021-го года, на hh.ru примерно вот такой расклад:
- Зарплата по Российской Федерации начинается от 65 тысяч рублей, в столице от 90 тыс. При том, что это заработная плата для новичков в этой профессии.
- Зарплата более опытного специалиста 90-160 тыс. рублей по РФ и 140-200 тыс. в Москве.
- Data Scientist высокой квалификации зарабатывает от 250 тыс. рублей.
Чем конкретно занимается Data Scientist?
В разных отраслях и в различных компаниях деятельность Data Scientist возможно
будет немного различаться, но, в целом, сценарий работы будет похож:
- Выяснить конкретную цель у заказчика, что ему нужно.
- Определить решает ли машинное обучение поставленную задачу.
- Если «да», тогда готовятся данные для анализа и подготавливается будущая
модель оценки. - Идет непосредственное программирование и тренировка модели машинного
обучения. - Определение целесообразности применяемой модели машинного обучения.
- Внедрение модели непосредственно в производственный процесс.
- Ведение, обработка и обработка введенной модели машинного обучения.
Что должен знать Data Scientist
Опять же в разных ситуациях по-разному, однако если в общих чертах, то это:
- Математика.
- Математическая статистика.
- Программирование.
- Основы машинного обучения.
- Сфера, где будете трудиться, как Data Scientist.
- Личные качества: коммуникабельность, ответственность, присутствие логики и
аналитического мышления, усидчивость, целеустремленность и мн.др.
С математикой и математической статистикой — лучше окончить
специализированные курсы и читать профильную литературу. Благо в сети, много
есть материалов на эту тему специально для подготовки Data Scientist.
Что касается языка программирования, то непосредственным лидером этой сферы
является Python. Он очень широко применяется в машинном обучении и в Big Data
соответственно. Учится достаточно легко, поэтому его часто рекомендуют даже
новичкам. Плюс этого языка в том, что даже, если вы не сможете себя реализовать,
как Data Scientist, то этот язык сможет вам пригодиться в других IT-сферах. Но если
вы его выучите и упорно будете идти к Data Scientist, то нужно будет пройти еще
несколько курсов непосредственно по алгоритмам машинного обучения. В сети их
тоже достаточно, как платных, так и бесплатных.
Возможно вам будет интересно почитать статью “Вода для Юнити. Как сделать воду на Unity 3d?”
Заключение
Data Scientist — это достаточно интересная специальность, в которой вы будете не
только кодить, но и решать интересные задачи, возможно даже очень важного
значения. Порог входа в эту профессию достаточно высок, однако при должном
упорстве и желании обучиться, любой заинтересованный новичок с ним справится.
Данная профессия совмещает в себе программирование и еще какую-нибудь сферу,
в которой возможно вы сильны и это будет вашим преимуществом. Поэтому дело за
малым: решиться и начать обучаться.