Top.Mail.Ru

Data Scientist: кто это и что он должен знать?

Иногда в поисках IT-направления, где реализоваться, соискатели сталкиваются с
такой профессией как «data scientist», тогда назревает резонный вопрос: кто это и
что он должен знать?
На этот и на другие вопросы, связанные с профессией «дата сайентист» мы
постараемся ответить в этой статье.

Data Scientist, кто это?

Data Scientist — это тот, кто является экспертом в аналитике данных. Помимо этого,
он должен обладать глубокими техническими знаниями для решения непростых
технических задач. Это и математики и компьютерные специалисты в одном лице,
задача которых работать и анализировать большое количество информации.
Ключевыми словами этой профессии являются:

  • громадные объемы информации;
  • полное отсутствие структуры в представленной информации.

Типичным примером такой работы является:

  • обработка метеорологических данных за какой-нибудь большой период времени и выявление закономерности;
  • обработка статистики запросов пользователей в поисковой системе;
  • анализ результатов спортивных соревнований;
  • работа с геномом различных микроорганизмов;
  • и мн.др.

Обычно работа дата сайентист включает в себя математическую статистику и
машинное обучение. Такой специалист проводит глубокий анализ данных, находит
закономерности и составляет прогнозы, чтобы найти оптимальное решение к
поставленной задаче. А задачи бывают разные.
Не стоит путать data scientist и бизнес-аналитику. Это совершенно разные вещи,
хотя в обеих профессиях идет работа с огромным объемом информации. Разница
скрыта в конечных результатах, которые получают в этих сферах:

  • Data Scientist — это тот, кто работает «для будущего», так как он находит в большом объеме информации закономерность и взаимосвязь, для того чтобы предугадать возможный результат, который может получиться в будущем. Он смотрит как решить поставленную задачу с технической стороны.
  • Бизнес-аналитик сосредотачивается на финансовых показателях компании, а не на технической части разрешения поставленных задач. Например, он анализирует эффективность рекламной компании, количество продаж за определенный период и т. д. И получив подобную информацию, старается улучшить коммерческие показатели организации. Иногда, для своего анализа такой специалист может привлечь Data Scientist в помощь.

Полезен ли труд Data Scientist?

На самом деле с трудами этих специалистов мы сталкиваемся в каждый день, ведь
это:

  • прогнозирование погоды;
  • голосовой помощник;
  • прогрессивный чат-бот;
  • генная инженерия;
  • представление возможных друзей в соцсетях;
  • и др.

Полезен ли такой труд? Скорее всего да, чем нет. Кстати, у основания поисковых
алгоритмов и алгоритмов распознавания человеческого лица, тоже стоят
специалисты Big Data.

Где можно встретить Data Scientist?

Data Scientist — это тот, кто может работать в различных сферах. Хоть эта
профессия и имеет тесную связь с IT, но специалистов Big Data можно встретить где
угодно:

  1. В любом направлении бизнеса. Дата сайентист может создать алгоритм для
    вычисления спроса на товар или услугу компании или же провести анализ: имеет и
    смысл открывать новое направление в бизнесе или открывать бизнес в новом
    регионе и т. д.
  2. В банковской сфере. Тут такой специалист легко рассчитает платежеспособность
    клиента и подскажет, можно ли ему выдавать кредит.
  3. В логистике. Алгоритмы Big Data помогут рассчитать оптимальный маршрут и
    способ доставки груза.
  4. В IT-направлении. Data Scientist может разработать бота, поисковый алгоритм или
    алгоритм машинного обучения.
  5. В производственных предприятиях. Тут разрабатываются различные алгоритмы
    вычисления необходимого количества производимой продукции, программы для
    вычисления вероятности сбоя оборудования или появления дефекта в продукции.
  6. В страховых организациях. Подобные программы вычисляют вероятности
    возникновения страховых случаев.
  7. В медицине. Автоматическое выставление диагноза на основании полученных
    данных — это тоже алгоритмы Big Data.
  8. В сельском хозяйстве. Прогноз возможного объема урожая и подбор оптимального
    использования земли — это рабочая сфера Data Scientist.
  9. В генной инженерии. Современные исследования в этой области просто не
    мыслимы без обработки огромного объема информации.
  10. В метеорологии. Мы уже затрагивали сегодня эту тему, прогноз погоды — это
    результат деятельности дата сайентист.

И список можно продолжать и продолжать. Это и физические исследования, и
космос,и спорт, и мн.др. Везде, где нужно составить прогноз на основе большого
количества данных — это поле деятельности для Data Scientist.

Заработок Data Scientist

Это достаточно востребованная профессия с хорошим заработком. Открытые
вакансии по этой профессии найти не сложно, но нужно быть хорошим
профессионалом своего дела. Машинное обучение сейчас «впереди планеты всей»,
а обучающие алгоритмы для этого и есть непосредственное поле деятельности Data
Scientist.
Что там по зарплатам? Приведем среднестатистические цифры, потому что многое
определяет опыт специалиста, сфера работы и деятельность самой компании. На
первое полугодие 2021-го года, на hh.ru примерно вот такой расклад:

  • Зарплата по Российской Федерации начинается от 65 тысяч рублей, в столице от 90 тыс. При том, что это заработная плата для новичков в этой профессии.
  • Зарплата более опытного специалиста 90-160 тыс. рублей по РФ и 140-200 тыс. в Москве.
  • Data Scientist высокой квалификации зарабатывает от 250 тыс. рублей.

Чем конкретно занимается Data Scientist?

В разных отраслях и в различных компаниях деятельность Data Scientist возможно
будет немного различаться, но, в целом, сценарий работы будет похож:

  1. Выяснить конкретную цель у заказчика, что ему нужно.
  2. Определить решает ли машинное обучение поставленную задачу.
  3. Если «да», тогда готовятся данные для анализа и подготавливается будущая
    модель оценки.
  4. Идет непосредственное программирование и тренировка модели машинного
    обучения.
  5. Определение целесообразности применяемой модели машинного обучения.
  6. Внедрение модели непосредственно в производственный процесс.
  7. Ведение, обработка и обработка введенной модели машинного обучения.

Что должен знать Data Scientist

Опять же в разных ситуациях по-разному, однако если в общих чертах, то это:

  1. Математика.
  2. Математическая статистика.
  3. Программирование.
  4. Основы машинного обучения.
  5. Сфера, где будете трудиться, как Data Scientist.
  6. Личные качества: коммуникабельность, ответственность, присутствие логики и
    аналитического мышления, усидчивость, целеустремленность и мн.др.

С математикой и математической статистикой — лучше окончить
специализированные курсы и читать профильную литературу. Благо в сети, много
есть материалов на эту тему специально для подготовки Data Scientist.
Что касается языка программирования, то непосредственным лидером этой сферы
является Python. Он очень широко применяется в машинном обучении и в Big Data
соответственно. Учится достаточно легко, поэтому его часто рекомендуют даже
новичкам. Плюс этого языка в том, что даже, если вы не сможете себя реализовать,
как Data Scientist, то этот язык сможет вам пригодиться в других IT-сферах. Но если
вы его выучите и упорно будете идти к Data Scientist, то нужно будет пройти еще
несколько курсов непосредственно по алгоритмам машинного обучения. В сети их
тоже достаточно, как платных, так и бесплатных.

Возможно вам будет интересно почитать статью “Вода для Юнити. Как сделать воду на Unity 3d?”

Заключение

Data Scientist — это достаточно интересная специальность, в которой вы будете не
только кодить, но и решать интересные задачи, возможно даже очень важного
значения. Порог входа в эту профессию достаточно высок, однако при должном
упорстве и желании обучиться, любой заинтересованный новичок с ним справится.
Данная профессия совмещает в себе программирование и еще какую-нибудь сферу,
в которой возможно вы сильны и это будет вашим преимуществом. Поэтому дело за
малым: решиться и начать обучаться.

Text.ru - 100.00%
Поделись статьей с друзьями!

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *