Top.Mail.Ru

Математическая статистика. Как подготовить?

Статистические данные можно собирать и анализировать, даже если под рукой есть
только карандаш и листок бумаги, но это медленно, трудно и долго. Чтобы
организовать такую работу быстрее, под рукой должна быть программа для
математической статистики. Благо, таких инструментов достаточно много и из всего
разнообразия есть, что выбрать на свой вкус.

Программа для математической статистики

Все мы часто используем статистическую программу и сами об этом не подозреваем.
Первой программой для математической статистики, которую знают многие,
является MS Excel, Да, это не полноценный инструмент для анализа, но ряд
простейших операций он выполняет:

  • сортирует данные;
  • проводит статистические вычисления;
  • строит некоторые виды графиков;
  • сохраняет нужные данные и служит подобием журнала для экспериментов;
  • и др.

Excel не предназначен для работы с большими научными данными, поэтому
полноценная статистическая обработка в нем невозможна. Но для ознакомления с
основами математической статистики и для небольших работ вполне годится.

Программы для математической статистики широкого применения

Итак, мы условились, что Excel для профессиональных статистических расчетов не
годится. Правда грань между профессиональным и непрофессиональным
статистическим расчетом размыта и не имеет четкого количественного определения.
Но представим, что она есть.
Инструменты для профессиональной математической статистики делятся на 2
группы:

  • у которых есть пользовательский интерфейс, для удобства пользователей;
  • у которых нет пользовательского интерфейса.

Наличие интерфейса на качество программы никак не влияет, на удобство —
возможно. Но на практике такое разделение очень заметно, потому что не каждый
пользователь способен контролировать программу через команды в «Консоли».
Люди на столько обленились, что им легче «тыкать» мышью по кнопкам, чем запомнить основные команды. Но многие серьезные приложения поддерживают оба
метода управления: консоль и интерфейс.
Помимо деления «есть интерфейс или нет», программы можно классифицировать
еще по сфере применения:

  • есть программы широкого применения, которые применяются в различных сферах;
  • есть программы узкого применения, которые применяются в одной-двух сферах.

Популярные программы широкого применения перечислены ниже.

R

Это первая программа для математической статистики. Это один из самых мощных
из всех известных инструментов для вычислений.
R — это язык программирования со своей собственной средой разработки, которая
устанавливается на все популярные платформы:

  • Windows;
  • Linux;
  • MacOS.

R имеет огромное количество различных библиотек, которые расширяют
возможности самого языка. В нативном варианте у него отсутствует графический
интерфейс, поэтому всю необходимую работу нужно будет выполнять через Консоль.
Но если это трудно, то тогда можно установить дополнительный плагин Rcmdr и в
этом случае появится интерфейс.
С одной стороны, трудность этого инструмента заключается в том, что нужно изучать
целый язык программирования. Но с другой стороны, его синтаксис настолько прост
и легок в изучении, что с этим проблем не возникнет. Плюс, у него очень обширная
обучающая документация и большое количество обучающих книг. Правда есть у них
один минус — основная масса обучающего материала на английском языке, поэтому
придется для начала подтянуть это язык, если до сих пор его не изучили.

SAS

SAS берет свое начало еще в 60-х годах, когда применялось для статистического
анализа в сфере сельского хозяйства. С тех пор, это приложение не остановило
своего развития и по факту мы имеем уже десятую версию программы. На
сегодняшний день SAS применяется в различных сферах научных исследований.
Эта программа для математической статистики имеет в своем арсенале Консоль и
пользовательский интерфейс, поэтому подойдет широкому кругу пользователей. Она
построена из отдельных модулей, каждый из которых, способен выполнять только
собственную задачу. Таким образом «сборку» SAS под свои задачи вы
осуществляете самостоятельно. Внутри программы реализован свой собственный
язык программирования, который очень индивидуален, но синтаксис его слегка похож на Бейсик. С языками R или S, которые часто используются в таких
программах, сходства нет.
SAS может принять данные как через Консоль, так и в виде отдельного внешнего
файла и выполняет работу любого уровня сложности.

Stata

Еще одно приложение широкого пользования, которое способно проводить
статистический анализ в разных областях.
Stata может инсталлироваться во все популярные операционные системы. Она
имеет собственную консоль для ввода данных, но также принимает данные из
внешних файлов. Те, кому трудно работать через Консоль, могут воспользоваться
уникальной возможностью этой программы — генерировать в автоматическом
режиме необходимые команды для внутреннего языка программирования прямо из
меню.

Statistica

Данная программа имеет несколько названий:

  • SPSS — Statistical Package for the Social Sciences — это старое название, когда программа принадлежала еще компании StatSoft;
  • PASW Statistics — Predictive Analytics SoftWare Statistics — это название программа приобрела после того, как перешла под управление компании IBM.

В принципе можно найти обе версии программы, которые работают безупречно. В
своем составе они имеют пользовательский интерфейс и возможность
интегрироваться с языком программирования R.
Statistica обладает практически безграничными ресурсами в плане статистических
вычислений, но эта возможность достигается требованиями к ресурсам компьютера,
на который она устанавливается. К примеру, оперативной памяти понадобится не
менее 1 ГБ.
Еще один момент, Statistica работает только в Windоws, поэтому если вы хотите ее
использовать в других системах, то нужно устанавливать уже версии SPSS или
PASW, которые работают во всех системах.
Программы данного семейства обладают настолько широкими возможностями для
математической статистики, что многие пользователи не используют и половины от
их всего потенциала. Единственная сложность в освоении этих программ — это
изучение их возможностей.

Программы для математической статистики «узкого» применения

Список программ для математической статистики широкого применения насчитывает
несколько десятков различных решений. Мы остановились на самых интересных и
популярных. Но помимо широкого применения, есть программы для узкой
спецификации, которые «заточены» под расчеты в определенной сфере
человеческой деятельности.

Приведем несколько примеров таких программ:

  1. SEER-Stat. Рассчитана для применения при подсчете статистических данных в
    онкологии. Данная программа поддерживается американским Институтом
    Онкологии. Она подсчитывает статистику по количеству заболевших,
    выживших и умерших людей.
  2. WinPEPL. Рассчитана для ведения подсчетов эпидемиологической статистики.
  3. SAGE(Statistical Analysis for Genetic Epidemiology). Рассчитана для ведения
    статистических данных в области генетики и эпидемиологии.
  4. MedCalc. Программа работает в исследованиях биомедицинской
    направленности.

Заключение

Сфер, где может быть использована программа для математической статистики
широкого или узкого применения, очень много. Мы привели лишь малую часть
программ узкого применения. К примеру, мы не учли сферы:

  • бизнеса;
  • экономики;
  • образования;
  • сельского хозяйства;
  • и др.

Там везде есть собственные программы для статистических подсчетов.
Также мы не учли многие программы широкого применения, которые тоже на слуху у
многих пользователей:

  • Minitab;
  • MatLab;
  • Octave;
  • GenStat;
  • JMP;
  • Analize-it;
  • EpilInfo;
  • OpenEpi;
  • Stadia;
  • и др.

Возможно вам будет интересно почитать статью “Предметно ориентированное программирование.”

Такое разнообразие программ для математической статистики не должно вас пугать
или отталкивать. Все что нужно, это изучить и попробовать одну-две программы,
чтобы найти ту, с которой будет удобно работать и изучать статистику.

Text.ru - 100.00%
Поделись статьей с друзьями!

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *