Рынок компьютерных программ анализа данных очень разнообразен, что является отображением многоплановости задач обработки экспериментальных данных в различных областях человеческой деятельности. Все пакеты, как зарубежные, так и отечественные делятся на три группы: профессиональные, универсальные и специализированные:
- Профессиональные могут работать с очень большими базами данных и имеют узкоспециализированные методы (SAS, BMPD). Стоимость таких пакетов составляет от $2 тыс. до $10 тысяч.
- Универсальные (или пакеты общего назначения) близки к профессиональным, но имеют меньшие возможности и более доступны по цене. Из зарубежных универсальных наиболее известные - Statistica, SPSS, Statgraphics, S-Plus, из отечественных - Stadia, Olimp и др.
- Специализированные пакеты содержат несколько методов (1-2): анализ временных рядов (Эвриста, Мезозавр, СтатЭксперт), методы классификации (Класс-мастер), контроль качества продукции и т.д. Полный сравнительный анализ современных статистических пакетов можно посмотреть в аналитической статье С.А.Айвазяна, В.С. Степанова (см. ссылку на электронные ресурсы).
Средства статистической обработки данных часто включают в электронные табличные процессоры (например, Excel), но реальный и более достоверный анализ лучше проводить в специальных статистических пакетах.
Методы многомерного анализа данных с разной степенью полноты представлены во всех универсальных статистических пакетах. В данном учебном пособии рассматриваются приёмы работы с универсальным пакетом Statistica и параллельно, там, где это возможно, с более лёгкими в освоении статистическими функциями Excel. Следует отметить, что "тяжеловесные" пакеты SPSS и Statistica предназначены для пользователей, владеющих статистическими методами на профессиональном уровне. Однако наш многолетний опыт обучения студентов статистическим методам на базе этого пакета позволяет говорить об эффективности его освоения.
Интегрированная система комплексного статистического анализа и обработки данных Statistica занимает одно из первых мест в мире среди программ статистической обработки данных. Первая версия пакета была разработана фирмой Statsoft Inc. (США) в 1991 году, в последние годы появились версии - 7.0 rus и 8.0. Начиная с версии 6.0 пакет полностью подстроен под стандартный Windows - интерфейс.
Пакет состоит из 19 специализированных статистических модулей, обладает мощной графической системой визуализации данных и результатов, имеет специальный инструмент для создания отчетов, встроенные языки программирования SQL, Statistica Вasic и макрокоманд, может обрабатывать очень большие массивы наблюдений (корреляционные матрицы размером 32000х32000). Поддерживает все стандарты: импорт из популярных электронных таблиц, публикация в Internet, мастер запросов к ODBC-базам данных.