Пускайте избранные SPSS-макросы из диалоговых окон: обновление |
Метки: Программирование в SPSS: macros |
Пускайте избранные SPSS-макросы из диалоговых окон |
Метки: Новости по тематике сообщества Программирование в SPSS: macros |
Близости для двоичных данных |
Метки: Переменные: двоичные (бинарные) Новости по тематике сообщества Программирование в SPSS: macros Меры сходства/различия |
SPSS-макросы для сравнения кластеризаций/классификаций |
Метки: Классификация с учителем Программирование в SPSS: macros Кластерный анализ |
Сравнение категорий в SPSS |
Дорогие участники сообщества!
Помогите, пожалуйста решить задачу в SPSS.
Если набор брендов (единый набор ответов по каждому из показателей), по каждому из них измеряется ряд показателей.
Некоторые ответы закодированы как дихотомия (множественный выбор), некоторые как сингл.
Нужно проверить гипотезу о том, что доля A> либо <долиB.
Итоговая таблица выглядит след.образом:
Brand 1 Brand 2 Brand 3
Показатель 1 A B С
Показатель 2 A B С
Показатель 3 A B С
Выборка случайная, n=700.
В данном случае доля считается от всех респондентов, участвующих в опросе, а не по группам (% по строке). 1 строка=1 вопрос.
Вопрос: какой лучше критерий использовать для проверки гипотезы, и как можно реализовать в SPSS подобное сравнение.
Сразу из размышлений: z-тест для пропорций,на первый взгляд, не подходит, т.к. выборка одна, без подвыборок.
|
Заполнение пропусков в массиве |
Коллеги, добрый день!
Предположим есть массив типа:
ID | V1 | V2 | V3 | V4 | V5 |
1 | 1 | 5 | 2 | ||
2 | 1 | 3 | 2 | ||
3 | 3 | 5 | 4 | ||
4 | 2 | 3 | 2 |
Как можно с помощью синтаксиса можно оперативно заполнить пропуски, таким образом, чтобы значения автоматически рассчитывались примерно следующим образом (для V3):
1. Если в массиве НЕТ значений в переменных V1, V2, то V3=0
2. Если в массиве есть значения в переменных V1 или V2, то V3 рассчитывается по формуле:
(a)Значение из ближайшей заполненной ячейки слева +
(b)разность между ближайшей заполненной ячейкой и ближайшей заполненной ячейкой справа
(c)деленная на общее число пустых ячеек между V3 и ближайшей заполненной ячейкой слева +1
(d)и умноженная на число пустых ячеек между V3 и ближайшее заполненной переменной слева)
V3=a+b/c*d
То есть для ID=1,
V2=1+(5-1)/3*1=1+1.33*1=2,66
V3=1+(5-1)/3*2=1+1,33*2=3,66.
Таким образом в итоге массив должен выглядеть следующим образом (новые значения выделены жирным):
ID | V1 | V2 | V3 | V4 | V5 |
1 | 1 | 2,33 | 3,66 | 5 | 2 |
2 | 0 | 1 | 1,5 | 3 | 2 |
3 | 3 | 4 | 5 | 4 | 0 |
4 | 0 | 2 | 3 | 2,5 | 2 |
Как сделать это долго и мучительно, я знаю, но я уверен, что есть быстрое и изящное решение.
Буду очень благодарен за помощь.
Метки: SPSS Statistics: как сделать в Программирование в SPSS: macros |
Обновления Kirill's SPSS macros page (на SPSStools.net) |
Метки: Программирование в SPSS: matrix Новости по тематике сообщества Программирование в SPSS: macros |
Как поделить данные по выраженности признака и анализ гипотезы о различии |
Всем доброго времени суток.
Я честно пыталась понять все сама, но тревожность берет свое :) посему прошу о помощи.
Дано: магистерская диссертация. Исследование с гипотезой о различии (идентичность людей, имеющих определенные установки, характеризуется особенностями по сравнению с не имеющими таковых). 3 выборки (по трем разным странам). 3 количественные методики, одна из них - фильтр, которая и определяет установки (две другие на особенности идентичности). Везде по ним Лайкерт, результаты по каждой шкале в 2 и 3 методиках - средние, в методике-фильтре высчитывается средний балл между ее 3 шкалами, получается общая цифра, выражающая установку.
Здесь у меня встала первая проблема: научница дала понять, что нужно высчитать, у кого в методике-фильтре признак (установка) выражен, а у кого нет. Я попробовала просто через средние (поделила на 3 уровня выраженности признака, исходя из средней + дисперсии) - она сказала, что так нельзя, и это можно сделать правильно с помощью таблиц сопряженности или Манна-Уитни. Пыталась разобраться, но так и не поняла, как это можно сделать.
Еще проблема осложнилась тем, что я проверила распределение (Колмогоров-Смирнов) по этой методике-фильтру, и в 2 странах из 3 гипотеза о нормальном была отвержена. Возможно, это потому что в этих выборках вышло по 40 чел., а в третьей 80.
Ладно, я попробовала выделить категории через процентили. Но там тоже вышло на 3 части разделение - а насколько я поняла слова научницы, нужно только 2 категории. Тогда возникла мысль: насколько правильно в данном случае будет перевести все в стены (и решит ли это проблему с распределением)?
И поэтому вопросы в следующем:
- как можно поделить данные по выраженности признака (выражен/не выражен)? (учитывая, что везде количественная шкала)
- и если дальше мне нужно выявлять различия с помощью U, то могу ли я сразу вбить все шкалы всех методик для проверки? (может ли Манна-Уитни сделать одну большую таблицу, как в случае с корреляциями, а не только попарно?)
- если Манна-Уитни не дает сведений о характере различий, то правильно ли я понимаю, что анализировать такие данные можно только по типу " между __ и ___ шкалами различий (не) обнаружено - возможно, потому что... *здесь данные из теории + возможные подтверждения своих мыслей корреляциями* " ?
- так ли это, что если данные не по нормальному распределению, то их нельзя соотносить на всю генеральную совокупность?
|
Эксперимент с балансировкой порядка и сочетания стимулов |
Метки: Дисперсионный анализ (ANOVA/MANOVA) |
Сложный вопрос на собеседовании |
Вчера в ботанической фирме задали мне сложный вопрос.
Есть 100 тарелочек. В каждой 100-150 росточков. У каждого росточка измерян корень. В каждую тарелочку добавлено какое то вещество. Всего 100 разных веществ. Есть еще контрольная тарелка с ростками что проросли в воде без удобрений. Как сравнить длину корня в 100 тарелках относительно контрольной?!
ANOVA тут не подходит, потому что хоть групп и больше 2, но очень много. И это влияет на df (degree of freedom).
Я предложила сделать 100 раз T-test :) Сравнивая каждый раз 1 тарелку с удобрением и тарелку с водой. Но это долго и мне сказали что есть еще способ.
Еще известно что некоторые из проростков вообще умерли.
Задача: отобрать удобрения которые significantly увеличивают корни лучше других.
Что посоветуете? Какой стат анализ?
Метки: Сравнение независимых выборок/групп Дисперсионный анализ (ANOVA/MANOVA) |
Пишу про распространённые студенческие ошибки в работе со статистикой |
Метки: Общие принципы статистики Заблуждения в статистике |
Анализ влияния многих факторов, взаимодействующих друг с другом |
Метки: Дисперсионный анализ (ANOVA/MANOVA) Регрессионный анализ Структурное моделирование (SEM) |
Средние ранги или средние |
Метки: Критерий Манна-Уитни |
мода отдельно для каждой категории |
Метки: Данные: фильтрация/отбор/расщепление Данные: агрегирование Данные: преобразование значений/подсчеты |
Обработка субшкал |
Метки: Данные: преобразование значений/подсчеты Данные: имена перем./описательные метки |