Logo bg.artbmxmagazine.com

Логиналната регресия за наситени и йерархични модели, приложени към оценката на недвижимите имоти

Anonim

Проблем, с който оценителят се сблъсква ежедневно, е анализът на качествени променливи (нечислени). Тъй като качествените променливи не представляват линейно поведение (нито се свеждат до линейни); Когато прилагат конвенционални техники за множествена регресия, те могат да генерират нереалистични модели или просто не се сближават с никаква стойност.

Loglinear Regression е статистически метод, чиято цел е да изучи „Класификацията“ на качествените променливи. Това е по същество модел на множествена линейна регресия между качествените променливи и неперианския логаритъм на честотата на данните (референтен) под формата:

loglinear-регресия-за-наситени-и-йерархични модели-приложени към недвижими имоти-оценка-1

Предишният модел съответства на пълен модел (наситен) за качествените променливи A, B и C; въпреки това предишният модел е тежък и сложен модел. По елементарен принцип на пристрастие трябва да се намерят един или повече по-прости модели, които генерират резултат с приемлива степен на точност и ги определяме като „Йерархични модели“, в смисъл, че ако параметърът е нулев, те също ще бъдат. тези условия за по-нисък ред

Статистическият пакет SPSS позволява, чрез алгоритъм, да се определи наситен модел и най-подходящият йерархичен модел.

По този начин ние получаваме модел, чиято променлива реакция е неперианският логаритъм на честотата ("брой") на данните (референтен) и проектните променливи са тези качествени променливи, избрани за определяне на стойността на свойството.

Ключови думи: регресия, корелация, логнален анализ, анализ на кореспонденцията, дихотомен, качествена променлива, категорична променлива, многоварианен анализ, таблица за непредвидени ситуации, йерархичен модел, наситен модел.

  • Теоретична рамка:

1.1 Какво е Loglinear регресия?

Логинеарните модели, за разлика от множеството регресионни модели, позволяват по-добър анализ в случай на качествени (категорични) дихотомични или политомични променливи.

В Loglinear Analysis след това той може да бъде определен като метод, чиято цел е да проучи връзките между качествени (или нечислени) променливи.

Регресионният или логинеарният анализ е статистически метод, чиято цел е да проучи „Класификацията“ на качествените променливи.

Логинеарната регресия по същество е многолинеен линеен регресионен модел между качествените променливи и неперианския логаритъм на честотата на данните (референтен) във формата:

Основното използване на Loglinear анализ е да се определи приноса на различните избрани категорични променливи при формирането на „Таблица за непредвидени ситуации“.

1.2 Какво представляват таблиците за непредвидени ситуации?

Тя се дефинира като „Таблица за непредвидени ситуации“ (таблици за кръстосана таблица), комбинация от две или повече таблици за разпределение по честота, подредени така, че всяка клетка или кутия на получената таблица представлява единична комбинация от „променливи в кръстосано число. ".

По такъв начин, че „Таблицата за непредвидени ситуации“ ни позволява да изследваме наблюдаваните честоти, които принадлежат към всяка от специфичните комбинации от две или повече променливи.

Например:

Таблица за случайност на анализа на връзката между предпочитанието на населението да живее в къща или апартамент в два основни града:

ЖИВОТ В КЪЩИ ЖИВЕЕ В АПАРТАМЕНТ.
Каракас 10 40 петдесет
Валенсия 30 двадесет петдесет
петдесет петдесет 100

Разглеждайки тези честоти, можем да идентифицираме връзките между променливите на „Таблицата за извънредни ситуации“ (например, населението на Каракас очевидно предпочита да живее в апартаменти).

Loglinear Regression ни предоставя по-сложен начин да анализираме „Таблиците за непредвидени ситуации“ и да определим статистическите взаимодействия на избраните променливи.

1.3 Дизайнерски променливи vs. Променливи на отговора

В техниките за множествена регресия говорим за „независими променливи“ и „зависими променливи“, определяйки зависимата променлива като тази, която се обяснява с комбинацията от независими променливи.

В Loglinear Regression не е възможно да се говори за зависими или независими променливи, тъй като става въпрос за свързване само на неперианския логаритъм на честотата (възникване или преброяване на данни), базиран на поредица от категорични (качествени) променливи.

И така, бихме говорили за „Дизайн променливи“ и „Променлива реакция“; като " променливи за проектиране " са онези категорични променливи (дихотомични или политомични), които избираме, за да изградим нашата Таблица за непредвидени ситуации и " Променлива реакция " честотата или появата на данните.

1.4 Доброта на Fit

Добротата на прилягането на Loglinear Regression се основава на „значимостта“ на отклонението (остатъчното) между наблюдаваната честота на данните и очакваната честота, генерирана от логалинеарния модел.

Тоест, моделът ще бъде по-добър като функция на минимизиране на разликата между наблюдаваната и очакваната честота.

Значимостта (p) или "доброто прилягане" на конкретен модел на линейна линия ще бъде оценена от: традиционния тест на квадратен Chi () и максималния вероятностен статистически тест на Пиърсън () (или коефициентът на вероятност на Pearson Chi-square, както е наименованието му на английски).

По такъв начин, че са изпълнени следните параметри:

  • Chi Square (): Максимална вероятностна статистика на Pearson (): Максимална значимост (Sig.): Минимална (Наситеният логинарен модел

2.1 Определение на наситен модел

Логинеарният анализ или регресия анализира неперианския логаритъм (Ln) на честотата на всяка клетка или кутия на таблица за непредвидени ситуации с помощта на линеен модел.

Следователно, Ln на честотата на всяка клетка или поле може да се изрази като сума от приноса на различните променливи, участващи във формирането на Loglinear Model.

Наситеният (или пълен) модел се дефинира като този, който съдържа ВСИЧКИ възможни основни ефекти и ВСИЧКИ възможни комбинации (ефекти от втори, трети или n-ти ред) на избраните променливи, които го съставят.

Тъй като наситеният логинарен модел може перфектно да възпроизведе изследваните данни, защото съдържа всички възможни комбинации от избраните променливи; приема се, че е тежък и сложен модел и обикновено не е най-желаният модел.

По елементарен принцип на пристрастие трябва да се намери един или повече по-прости модели, които генерират резултат с приемлива степен на точност и ние ги определяме като „Йерархични модели“ и това ще бъде анализирано по-късно.

2.2 Пример за наситен логинарен модел

Да предположим, че за проучване на оценката на ваканционни апартаменти в крайбрежен град, ние искаме да проучим връзката между променливите на категорията:

X: Изглед към океана

Y: Сграда с басейн

Z: Сграда с паркинг за посетители

Уравнението за наситен логинарен модел е дадено от:

Където:

Представлява честотата на всяка клетка или мрежа от продукта на таблицата за условни ситуации на взаимодействието на данните (референтни) и избрани променливи

Представлява независимия термин на уравнението

Представлява "основния ефект" на количествената или категориалната променлива X

Представлява "основния ефект" на количествената или категориалната променлива Y

Представлява "основния ефект" на количествената или категориалната променлива Z

Представлява "ефекта от втори ред" или комбинацията от категоричните променливи X ý Y

Представлява "ефекта от втори ред" или комбинацията от категоричните променливи X ý Z

Представлява „ефекта от втори ред“ или комбинацията от категоричните променливи Y ý Z

Представлява „ефекта от трети ред“ или комбинацията от променливи от категории X, Y и Z

2.3 Недостатък на наситения модел

Наситеният модел, макар че очевидно винаги е вярно, предполага неуправляем брой уравнения; например за предишния случай Девет уравнения. Следователно това е тежък и изключително сложен модел.

Следователно е необходимо да се търси един или повече по-прости модели, които отчитат тези честоти с приемлива степен на точност за дадено ниво на увереност.

Когато анализирате таблици за непредвидени четвърти ред или по-високи, определянето на най-добрия модел на Loglinear Regression може да бъде много трудно. Тук ще влезе търсенето на по-опростен модел на корелация.

  • Йерархични логинични модели

3.1 Определение

Йерархичните логинични модели се дефинират като различните модели, всички под-игри (уравнения от по-нисък ред от наситения модел) от наситен логариентен модел, които отговарят на следните условия:

  1. Ако параметърът е нулев, такива ще бъдат и тези от по-нисък ред. Това има пълна независимост между избраните променливи

Ако тези условия са изпълнени, се генерира по-опростен, по-елегантен Loglinear модел с приемлива степен на точност.

3.2 Йерархична връзка

За модел с три (3) проектни променливи A, B и C, може да се получи голям брой йерархични модели от по-нисък ред, като следните:

  • Йерархичен модел от трети ред (наситен модел): Йерархични модели от втори ред Йерархични модели от първи ред ИЛИ всяка валидна комбинация:

3.3 Получаване на най-подходящия йерархичен модел

3.3.1 Общ метод

Методът за търсене на най-добрия йерархичен модел, използван най-често от статистически пакети, посветени на това, което е известно като „Обратно премахване“.

Тази методология комбинира използването на k (th) граници и тест на Chi-квадрата, за да се намери йерархичен модел или няколко значими йерархични модели

  1. Започваме с изчисляването на наситения модел.Иерархичният модел или йерархичните модели от по-висок ред се анализират. Моделът или моделите от този ред, които не са значими, се елиминират (). Йерархичните модели от по-нисък ред се елиминират в същите променливи. Йерархичните модели се анализират. Процесът продължава до степен, в която повече ефекти не могат да бъдат елиминирани, без да се жертва прогнозната сила на модела (), остават постоянни или са склонни да намаляват или увеличават.

3.3.2 Използване на SPSS при определяне на моделите на логиналната регресия

Целта на тази монография изобщо не е текст за техниките на Loglinear Regression.

По-скоро това е прилагането на нов статистически инструмент за решаване на проблеми, свързани с оценяването, в случай на използване на нечислени или качествени променливи.

Следователно, след като статистически-математическата теория на логиновидните модели (наситени и йерархични) е изложена по много схематичен начин, ще пристъпим към проучване на практически случай, използвайки статистическия пакет SPSS версия 10.0.

Статистическият пакет SPSS, чрез модула Loglinear, позволява определянето на наситени и йерархични статистически модели.

В рамките на „Йерархични модели“ SPSS позволява или автоматично да избира Hierarchical Best Fit Model, или позволява на потребителя да избира или моделира всеки подмножество от променливи.

Разработването на тази монография се основава на автоматичното определяне на най-подходящия йерархичен модел според алгоритъм на SPSS.

SPSS използва метода, наречен „Елиминиране назад“, споменат по-рано, за да определи възможно най-подходящия Loglinear модел.

Трябва да се отбележи, че алгоритъмът „Backend“ е дълъг и заема около петнадесет (15) страници текст при отпечатване на резултатите.

По принцип процесът на изчисление може да бъде обобщен в следните общи стъпки:

  1. Правилно научени данни за корелация в "Редактора на данни" (Редактор на данни) на пакета Процедурите за изчисляване на SPSSLos в SPSS са в менюто Анализиране В рамките на менюто Анализ подпрограмата или модулът е Loglinear. С модула Loglinear, Намерете три (3) подменюта:
    1. ОбщиЛогит
  • Избор на модел… След като на екрана се намира логиналният анализ за избор на модел, преминете към:
    1. Изберете "Проектни променливи", за да бъдете свързани. Определете минималния и максималния диапазон на данните, които съставят всяка от "Проектни променливи".
    Определете опциите за изчисление и изход на моделите.E Започнете анализа с помощта на бутона OK.
  1. След като SPSS приключи изчисленията, той ще представи изхода на моделите на екрана на SPSS Viewer, в текстова форма. Оттам потребителят може да го отпечата на хартия или да "експортира" изхода в текстов файл за използване в текстов процесор или електронна таблица.

3.4 Тълкуване на SPSS продукцията

Може би най-големият проблем за оценителя е интерпретацията на SPSS изхода.

На първо място трябва да имате някои основни познания за това, което възнамерявате да направите, тъй като статистическият пакет генерира голямо количество информация, която трябва да знаете как да идентифицирате и оцените. Второ, необходимо е да се разбере, че пакетът SPSS ще генерира „Таблици за непредвидени ситуации“ от различни нива и е необходимо да има основни знания, за да ги сглобявате, за да можете да интерпретирате резултатите от модела.

Специализираният статистически пакет на SPSS представя стандартен резултат, който обикновено се състои от:

  1. Генериране на статистически данни за контрол на наситен логинеен модел на наситения логинарен модел
    1. Степени на свобода (F.) Квадрат на Чи () Максимална вероятност на статистиката на Пиърсън () Значимост (Проба) Други статистически данни за контрол
    Процедура за Backelimination за изчисляване на Hierarchical Loglinear Best Fit Model, където софтуерът:
    1. Част от наситения логинарен модел анализира всички възможни йерархични модели, като се започне от най-високия до най-ниския ред Показва за всяка от „йерархичните модели“ съответната им контролна статистика Предлага в края като „Йерархичен модел на най-доброто прилягане“ този, който има
      1. „Pearson Максимална вероятностна статистика“ (): Максимум „Значимост“ (): Минимум
  1. Генериране на:
    1. Йерархичен логинарен модел на „Най-доброто“ Статистика на йерархичния логинарен модел на контрол
      1. Степен на свобода (DF) Статистика за максималната вероятност на Pearson ()
  • Значение (Проб.)

4.0 Логинеарната регресия за наситени и йерархични модели, приложени към оценката на недвижимите имоти.

4.1 Прилагане на Loglinear регресия при оценка на недвижими имоти

Проблем, с който оценителят се сблъсква ежедневно, е анализът на качествени или категорични променливи (не числови), като изглед на апартаменти, качество на съседство, удобства в общите части, сигурност; които са "Нематериални характеристики" несъмнено допринасят за формирането или унищожаването на стойността на имот.

Тъй като качествените или категоричните променливи не представляват линейно поведение (нито се свеждат до линейни); чрез прилагане на конвенционалните техники за множествена регресия, включително техники на невронната мрежа; те могат да дадат непоследователни резултати или просто да не се сближат с никаква стойност.

4.2 Оценка по таблици за непредвидени ситуации

Тъй като крайната цел на Loglinear анализа е да се определи конформацията на „Таблици за непредвидени ситуации“. Оценката на даден имот ще се основава на местоположението на неговите характеристики в рамките на тази „генерирана таблица за непредвидени ситуации“.

Следователно тук ще бъде представен различен подход към Традиционната методология за изготвяне на оценка.

Досега физическите характеристики (площ, възраст, местоположение и др.) На имота са анализирани, за да се определи неговата стойност.

В този нов подход „Диапазонът на стойността“ на свойството ще зависи от позицията му в „Таблица на непредвидени ситуации“, генерирана от „Логинеен анализ“. Тъй като променливата "Price" (или единична цена) е само още една "Design Variable".

В тази нова перспектива "категорията", която досега имаше, променливата "цена" (или единична цена) е намалена и е сведена до още един компонент от различните параметри, които заедно могат да определят позицията на свойство в таблица за непредвидени ситуации и следователно определят неговия "Диапазон на стойностите".

4.3 Пример за приложение

Поради новостта на метода и сложността на интерпретацията на входовете / изходите от данни. Този метод ще бъде обяснен стъпка по стъпка при подхода на много прост модел за оценка.

4.3.1 Описание на проблема

Това е оценката на ваканционните апартаменти в няколко подобни урбанизации на венецуелския Барловенто (в околностите на Рио Чико. Миранда, щат), като Лос Каналес, Лас Мерцедес, Лагунамар и др.

Тъй като това е прост пример за приложение, беше избрана само малка извадка от 18 референтни данни от много подобни апартаменти.

4.3.2 Избрани категорични променливи

Тъй като този пример илюстрира доказателството за логистична регресия, ще бъдат използвани само следните категорични или качествени променливи:

4.3.3 Избрани референции

Всички справки са взети от Subaltern Office of the Public Registry of Río Chico и съответстват на нотариално заверени документи през първото тримесечие на годината 2,003.

4.3.4 Кодиране на данни

Съгласно критериите, използвани в раздел 4.3.2 по отношение на избраните проектни променливи, ще бъде подготвена матрица от кодирани данни, за да могат да ги въвеждат в статистическия пакет SPSS.

4.3.4.1 Избор на проектни променливи

4.3.4.1 Кодиране на проектни променливи

4.3.5 Извадки от резултатите от статистическия пакет на SPSS

4.3.5.1 Спецификация на Loglinear Model

* * * * * * * * HIERARCHICALLOGLINEAR * * * * * * * *

Информация за данни

Приети са 18 претеглени дела.

0 отхвърлени случаи поради стойности на фактора извън обхвата.

0 случаи отхвърлени поради липсващи данни.

В анализа ще бъдат използвани 18 претеглени случая.

Информация за ФАКТОР

Етикет на ниво фактор

ЦЕНА 4

ПАЗАР 2

POOL 2

ВИЖТЕ 2

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

4.3.5.2 Статистически данни за наситен логинален контрол на модела

* * * * * * * * HIERARCHICALLOGLINEAR * * * * * * * *

ДИЗАЙН 1 има генериращ клас

ЦЕНА * ПАЗАР * БОЙН * ВИЖТЕ

Забележка: За наситени модели.500 е добавен към всички наблюдавани клетки.

Тази стойност може да бъде променена с помощта на подкоманда CRITERIA = DELTA.

Алгоритъмът Iterative Proportional Fit се сближи при итерация 1.

Максималната разлика между наблюдаваните и монтираните пределни суми е.000

а критерият за конвергенция е.250

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Статистически данни за тестовете за добро съответствие

Коефициент на вероятност чи квадрат =.00000 DF = 0 P = 1.000

Pearson chi квадрат =.00000 DF = 0 P = 1.000

4.3.5.3 Метод за премахване назад: Списък на всички възможни ефекти от 3-ти, 2-ри и 1-ви ред

* * * * * * * * HIERARCHICALLOGLINEAR * * * * * * * *

Тестове на ЧАСТИЧНИ асоциации.

Име на ефекта DF Частичен Chisq Prob Iter

ЦЕНА * ПАЗАР * БОЙН 3.044.9976 3

ЦЕНА * ПАЗАР * ВИЖТЕ 3.189.9794 2

ЦЕНА * БЕЗОПАС * ВИЖТЕ 3.000 1.0000 4

ПАЗАР * БИЛКА * ВИЖТЕ 1.000 1.0000 3

ЦЕНА * ПАЗАР 3 7.869.0488 4

ЦЕНА * БОЙЛ 3 5.039.1690 3

ПАЗАР * POOL 1.629.4276 4

ЦЕНА * ВИЖТЕ 3 5.917.1157 4

ПАЗАР * ВИЖТЕ 1.777.3779 4

POOL * ВИЖТЕ 1 7.530.0061 2

ЦЕНА 3 8.089.0442 2

ПАЗАР 1.223.6370 2

БОЛЕСТ 1.896.3438 2

ВИЖТЕ 1.896.3438 2

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

4.3.5.3 Метод за елиминиране назад: Избор на йерархичен модел за най-добро прилягане

Стъпка 9

Най-добрият модел има генериращ клас

ЦЕНА * ПАЗАР

ЦЕНА * ВИЖТЕ

POOL * ВИЖТЕ

Коефициент на вероятност чи квадрат = 6.33129 DF = 18 P =.995

* * * * * * * * HIERARCHICALLOGLINEAR * * * * * * * *

Крайният модел има генериращ клас

ЦЕНА * ПАЗАР

ЦЕНА * ВИЖТЕ

POOL * ВИЖТЕ

Алгоритъмът Iterative Proportional Fit се сближи при итерация 0.

Максималната разлика между наблюдаваните и монтираните пределни суми е.000

а критерият за конвергенция е.250

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Моделът Loglinear Best Fit е следният:

4.3.5.4 Определяне на наблюдаваните и очакваните честоти на йерархичния логинарен модел:

Наблюдавани, очаквани честоти и остатъци.

Код на коефициента OBS count EXP count Остатъчен Std Resid

ЦЕНА 1

ПАЗАР 0

POOL 0

ВИЖТЕ 0 3.0 2.5.45.28

ВИЖТЕ 1.0.0.00.00

БОЙЛ 1

ВИЖТЕ 0 1.0 1.5 -.45 -.38

ВИЖТЕ 1.0.0.00.00

ПАЗАР 1

POOL 0

ВИЖТЕ 0 1.0.6.36.46

ВИЖТЕ 1.0.0.00.00

БОЙЛ 1

ВИЖТЕ 0.0.4 -.36 -.60

ВИЖТЕ 1.0.0.00.00

ЦЕНА 2

ПАЗАР 0

POOL 0

ВИЖТЕ 0 2.0 1.7.30.23

ВИЖТЕ 1.0.0.00.00

БОЙЛ 1

ВИЖТЕ 0 1.0 1.0.03.03

ВИЖТЕ 1 3.0 3.3 -.33 -.18

ПАЗАР 1

POOL 0

ВИЖТЕ 0 1.0.8.15.16

ВИЖТЕ 1.0.0.00.00

БОЙЛ 1

ВИЖТЕ 0.0.5 -.48 -.70

ВИЖТЕ 1 2.0 1.7.33.26

ЦЕНА 3

ПАЗАР 0

POOL 0

ВИЖТЕ 0.0.0.00.00

ВИЖТЕ 1.0.0.00.00

БОЙЛ 1

ВИЖТЕ 0.0.0.00.00

ВИЖТЕ 1.0.0.00.00

ПАЗАР 1

POOL 0

ВИЖТЕ 0.0.6 -.64 -.80

ВИЖТЕ 1.0.0.00.00

БОЙЛ 1

ВИЖТЕ 0 1.0.4.64 1.06

ВИЖТЕ 1.0.0.00.00

ЦЕНА 4

ПАЗАР 0

POOL 0

ВИЖТЕ 0.0.0.00.00

ВИЖТЕ 1.0.0.00.00

БОЙЛ 1

ВИЖТЕ 0.0.0.00.00

ВИЖТЕ 1.0.0.00.00

ПАЗАР 1

POOL 0

ВИЖТЕ 0.0.6 -.64 -.80

ВИЖТЕ 1.0.0.00.00

БОЙЛ 1

ВИЖТЕ 0 1.0.4.64 1.06

ВИЖТЕ 1 2.0 2.0.00.00

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

Статистически данни за тестовете за добро съответствие

Коефициент на вероятност чи квадрат = 6.33129 DF = 18 P =.995

Pearson chi квадрат = 4.96161 DF = 18 P =.999

4.3.6 Начертаване на таблицата за действие в извънредни ситуации

4.3.7 Друг начин за представяне на таблицата на континентите по по-лесен за разбиране начин:

4.3.8 Примери за приложение:

4.3.8.1 Пример номер 1:

Бъдете ваканционен апартамент в урбанизацията на Лос Каналес със следните характеристики:

  • Нова сграда с изглед към канала с басейн

Всички редове, които включват следните характеристики, са разположени в "Таблица за непредвидени ситуации":

  • НОВО = 1ВИЖ = 1ПООЛ = 1

Това ще включва следната подкамера:

Както е отбелязано в таблицата за непредвидени ситуации, има четири (4) възможни ценови диапазона (PRICE) за определяне на стойността на апартамента, който трябва да бъде оценен. Но при наблюдение на Четвъртия ред се забелязва, че ОЧАКВАНАТА ЧЕСТОТА е максимална.

Следователно, Апартаментът се намира в този ред в Таблицата за непредвидени ситуации, а ценовият му диапазон е ЦЕНА = 4. Това показва, че Стойността на посочения имот е в диапазона от апартаменти, по-голям от 55 милиона Боливара.

4.3.8.2 Пример номер 2:

Бъдете ваканционен апартамент в урбанизацията на Лос Каналес със следните характеристики:

  • Използвана сграда с изглед към канала с басейн

Решение:

Всички редове, които включват следните характеристики, са разположени в "Таблица за непредвидени ситуации":

  • НОВО = 0ВИЖВАНЕ = 1POOL = 1

Това ще включва следната подкамера:

Както е отбелязано в таблицата за непредвидени ситуации, има четири (4) възможни ценови диапазона (PRICE) за определяне на стойността на апартамента, който трябва да бъде оценен. Но при наблюдение на Втори ред се забелязва, че ОЧАКВАНАТА ЧЕСТОТА е максимална.

Следователно, Апартаментът се намира в този ред в Таблицата за непредвидени ситуации, а ценовият му диапазон е ЦЕНА = 2. Това показва, че Стойността на посочения имот е в диапазона на апартаментите между 25 и 40 милиона боливара.

4.3.8.3 Пример номер 3:

Бъдете ваканционен апартамент в урбанизацията на Лос Каналес със следните характеристики:

  • Използва се ApartmentCanal ViewBuilding без басейн

Решение:

Всички редове, които включват следните характеристики, са разположени в "Таблица за непредвидени ситуации":

  • НОВО = 0ВИЖВАНЕ = 1POOL = 0

Това ще включва следната подкамера:

Както е отбелязано в таблицата за непредвидени ситуации, има четири (4) възможни ценови диапазона (PRICE) за определяне на стойността на апартамента, който трябва да бъде оценен. Но когато погледнем таблицата за непредвидени ситуации, се забелязва, че ОЧАКВАНАТА ЧАСТОТА е 0,0 за всички възможни комбинации от данни.

Логичното заключение за този случай е, че на модела бяха предоставени достатъчно данни, за да се генерира какъвто и да е вид комбинация между дизайнерските променливи, за да се определи стойността на този тип апартаменти в частност.

Следователно стойността на този апартамент не може да бъде определена с помощта на настоящия йерархичен логинарен модел

  • Заключения
  1. Техниките на йерархична логинеарна регресия обясняват много по-добре поведението на статистическите явления от множествените регресионни техники или невронните мрежи, в случай на категорични серии от данни. В задачите за класифициране, йерархичните логинейни модели генерират много по-точни резултати, отколкото Множество логистични регресионни модели, въпреки че и двата метода са предназначени за категорични серии от данни, за разнородни серии от данни (смесени категорични и количествени), изкуствени невронни мрежи и техники за множествена регресия, далеч надминават йерархичните логинарни модели. Използването на йерархични логинични модели е мощен инструмент за "масивна оценка" на движимо и недвижимо имущество, тъй като позволява класифициране на имота в предварително създадени таблици за непредвидени ситуации.статистическият пакет SPSS е много ясен в обработката, функционирането и интерпретацията на резултатите. Трудно е да се адаптират йерархични логинични модели като просто средство за анализ, което да се използва от оценители без основни познания по въпроса.

Инж. Роберто Пиол Пупио

CIV 32.290 / SOITAVE 260

www.joinme.net/rpiol

Електронна поща: [email protected]

2,003 ноември

ЛИТЕРАТУРА

  • BERRIDGE D. (1994) „Оценка на доброто прилягане на регресионните модели за обикновени категорични данни“, 9-ти Международен семинар по статистическо моделиране, Университет Ексетер. London.CAMERON T. и QUIGGIN J. (1994) "Оценка с използване на данни за условни оценки от" дихотомен избор с последващ "въпросник". Списание за икономика и управление на околната среда. Предстоящо. New YorkTABACHNICK BG и FIDELL LS (1996). „Използване на многовариантна статистика“, 3-то изд. Харпър Колинс, Ню Йорк. GEORGE D и MALLERY P. (2000) "Spss за прозорци стъпка по стъпка." Allyn & Bacon. Massachusetts.JOBSON JD (1992) „Приложен многоварианен анализ на данни. Vollume II ". Springer Verlag Ню Йорк.LOZARES C., LOPEZ P. AND BORRAS V. (1998) "Допълняемостта на логаритмичния линеен анализ и анализа на съответствията при разработването и анализа на типологиите".Доклади на Автономния университет в Барселона. Номер 55 стр. 79-93. Барселона.PIOL R. (1989-2002) „Статистически методи, прилагани при оценката на недвижими имоти“. SOITAVE. Caracas.PIOL R. (2002) "Невронни мрежи, приложени за оценка на недвижими имоти". Списание SOITAVE. Номер 54 септември 2,002 стр. 42-49 Каракас РАЗЛИЧНИ АВТОРИ (1999) „Тестове за независимост с помощта на многостранни таблици за действие в непредвидени случаи в spss“ Тексаският университет. Остин РАЗЛИЧНИ АВТОРИ (1995) “Линеен анализ на честотни таблици” Statsoft, Inc. Електронни учебници. Достъп http://www.statsoft.com/textbook/stloglin.html WHITELEY, P. (1983) „Анализът на таблиците за непредвидени ситуации“. Н. Schofield & P. ​​Whitely (редактори). Лондон.Caracas.PIOL R. (2002) "Невронни мрежи, приложени за оценка на недвижими имоти". Списание SOITAVE. Номер 54 септември 2,002 стр. 42-49 Каракас РАЗЛИЧНИ АВТОРИ (1999) „Тестове за независимост с помощта на многостранни таблици за действие в непредвидени случаи в spss“ Тексаският университет. Остин РАЗЛИЧНИ АВТОРИ (1995) “Линеен анализ на честотни таблици” Statsoft, Inc. Електронни учебници. Достъп http://www.statsoft.com/textbook/stloglin.html WHITELEY, P. (1983) „Анализът на таблиците за непредвидени ситуации“. Н. Schofield & P. ​​Whitely (редактори). Лондон.Caracas.PIOL R. (2002) "Невронни мрежи, приложени за оценка на недвижими имоти". Списание SOITAVE. Номер 54 септември 2,002 стр. 42-49 Каракас РАЗЛИЧНИ АВТОРИ (1999) „Тестове за независимост с помощта на многостранни таблици за действие в непредвидени ситуации в spss“. Тексаският университет. Остин РАЗЛИЧНИ АВТОРИ (1995) “Линеен анализ на честотни таблици” Statsoft, Inc. Електронни учебници. Достъп http://www.statsoft.com/textbook/stloglin.html WHITELEY, P. (1983) „Анализът на таблиците за непредвидени ситуации“. Н. Schofield & P. ​​Whitely (редактори). Лондон.Електронен учебник. Достъп http://www.statsoft.com/textbook/stloglin.html WHITELEY, P. (1983) „Анализът на таблиците за непредвидени ситуации“. Н. Schofield & P. ​​Whitely (редактори). Лондон.Електронен учебник. Достъп http://www.statsoft.com/textbook/stloglin.html WHITELEY, P. (1983) „Анализът на таблиците за непредвидени ситуации“. Н. Schofield & P. ​​Whitely (редактори). Лондон.

РЕГРЕСИЯ НА ЛОГЛИНАТА ЗА САТУРИРАНИ И ЙИЕРАРХИЧНИ МОДЕЛИ, ПРИЛОЖЕНИ ЗА ОЦЕНКА НА НЕДВИЖИМИ ИМОТИ.

Допринесе от: инж. Роберто Пиол Пупио - [email protected]

Дихотомна променлива (като "С океански изглед" = 1 или "Без изглед към океана" = 0) е пример за качествена / категорична променлива. Тъй като качествената и дихотомична променлива „Изглед към морето“ не е линейна, когато се комбинира с други независими променливи, независимо дали е количествена или качествена (като площ на строителство, възраст на свойството и т.н.) в множествен линеен регресионен модел, твърде малко вероятно е правилно да се прецени или прогнозира променливата „Единична цена“ въз основа на тези смесени променливи.

Когато се използват количествени (или числови) променливи, те говорят за "Техники за прогнозиране или оценка"; докато когато се използват качествени или категорични променливи, тогава ще се говори за "техники за класификация"

Концепция, аналогична на остатъчната теория, която се използва в методите за множествена регресия за идентифициране на нетипични данни, съдържащи се в серия от данни.

Тестът за максимална вертикалност на Пиърсън (LRT, L 2 или G 2както е известно в различни текстове), това е статистически тест за доброто прилягане между два модела. Сравнително по-сложен модел се сравнява с по-опростен модел, за да се види дали те сравняват значително добре за определен набор от данни. LRT е валиден само ако сравнявате с йерархично вложени модели. Тоест по-сложният модел трябва да се различава само от простия модел чрез добавяне на една или повече променливи; по такъв начин, че при добавянето на допълнителни променливи се получава по-голяма доброта на прилягане. Има обаче смисъл, когато добавянето на допълнителни променливи НЕ значително ще подобри доброто прилягане на по-простия модел. LRT поддържа обективен критерий, избиращ сред възможните модели. LRT започва с сравнение на квадратите Chi на формата:

Тоест разликата на естествените логаритми на Chi-квадратите се оценява въз основа на разликата на Степените на свободата. LRT приблизително следва този на модела.

Може да се цитира аналогията на тази концепция с тази на факторния анализ за множествена регресия. Факторният анализ позволява да се получи по-прост модел на множествена линейна регресия с по-малко променливи, като се елиминират „Незначителни променливи“, но в същото време се поддържа приемлив резултат при предварително определено ниво на увереност.

Тестът "Пълна независимост" предполага, че в йерархичния модел всички променливи са независими една от друга. Това се получава чрез сравняване на Chi-квадратите на всяка променлива с „Нулевата хипотеза“ (получена от таблицата за съответните степени на свобода). Когато трябва да бъде изпълнено, че:

Ако горното е вярно, това показва, че независимият йерархичен модел е значително различен от наситения модел, което предполага, че този йерархичен модел съдържа променливата или променливите, необходими за получаване на добра корелация или съвпадение.

SPSS версия 10.0 е собственост на SPSS, Inc. Всички права запазени.

Въпреки това, SPSS позволява изходът да се експортира изцяло като текстов файл, което позволява на инженер-оценител да добавя извлечения от него към Отчета за оценка, за да поддържа операциите.

В Модел подбор подменю…, е подпрограма или модул, където е намерена алгоритъма за определяне на йерархични модели; обаче тук "Наситеният модел" се определя автоматично, тъй като методът на Backelimination започва с изчисляването на Sat sat Model, както вече беше обяснено в текста.

Тъй като Loglinear Regression е метод, фокусиран върху класификацията на категорични променливи, данните обикновено се изразяват като цели числа (например: 0 и 1 в случай на дихотомични променливи).

За по-добро обяснение и подробни инструкции за работата на програмата вижте ръководството за инструкции за SPSS.

SPSS изходът може да варира в зависимост от опциите за изчисление и изход, определени от потребителя.

Loglinear модели се отпечатват като многостепенни матрици в изхода на пакета

Hierarchical Loglinear моделът се отпечатва като многостепенна матрица в изхода на пакета

Очевидно е, че променливата „цена“ или „единична цена“ е числова или количествена променлива и следователно трябва да бъде „преобразувана“ в качествена или категорична променлива. За това вече няма да може да се говори за променлива цена (единична цена), а за променлива „Ценови диапазон“.

Обърнете внимание, че това са само категорични или качествени променливи.

SPSS представя изхода на екрана на SPSS Viewer, в текстова форма. Този изход може да бъде отпечатан или експортиран като текстов файл.

Наситеният логинарен модел съдържа всички възможни „основни ефекти“ и всички възможни комбинации от „комбинирани променливи ефекти“, следователно перфектно възпроизвежда данните (). Наситеният логинарен модел не е показан в този откъс от SPSS изхода

Пакетът SPSS стига до определянето на йерархичния логинарен модел на „Най-доброто“, като се започне от наситен модел и се елиминират онези ефекти от всяка поръчка, които не допринасят значително за модела; така че „Статистиката на максималната вероятност на Пирсън“ () е максимална и „Значимостта“ () е минимална

Логинеарният йерархичен модел представя "Таблицата за непредвидени ситуации" като многостепенна матрица на изхода на пакета. Сега ще продължим да "въоръжаваме" този изход в матрична форма, за по-лесното му тълкуване. "Очаквани честоти" ще бъдат използвани като коефициенти на "Таблица за непредвидени ситуации".

Електронната таблица MS-Excel ще бъде използвана за очертаване на таблицата за непредвидени ситуации.

Не забравяйте, че данните са съставени от само 18 справки, тъй като това е дидактически модел.

Аналогия на този тип проблем е случаят с множество модели на регресия, които отлично обясняват определено свойство; но оценката се проваля, когато се прилага същият модел на регресия към друго свойство с физически характеристики, много различни от първия.

Логиналната регресия за наситени и йерархични модели, приложени към оценката на недвижимите имоти