Цены на жилье Сбербанка Archives — Journey of Analytics
Это второй пост анализа жилищного фонда Сбербанка России, в котором мы сузим интересующие нас переменные и создадим дорожную карту, чтобы понять, какие факторы существенно влияют на целевую переменную (price_doc).
Вы можете прочитать вводный первый пост здесь.
Дорожная карта анализа:
Этот набор данных Kaggle содержит около 290 переменных, поэтому важно иметь четкое направление. На начальном этапе мы, очевидно, не знаем, какая переменная значима, а какая нет, поэтому просто прочитаем словарь данных и логически выберем интересующие переменные. Используя их, мы создаем нашу гипотезу, то есть взаимосвязь с целевой переменной (цена дома) и проверяем силу взаимосвязи.
Набор данных также включает макроэкономические переменные, поэтому мы также создадим производные переменные для проверки взаимодействия между переменными.
Простая интеллектуальная карта для этого набора данных выглядит следующим образом:
интеллектуальная карта анализа цен на жилье
Гипотезы Qs:
Гипотеза Qs и представляющие интерес переменные-предикторы перечислены ниже:
Целевая переменная: (TV)
«price_doc» является переменной для прогнозирования. В дальнейшем это будет называться «ТВ».
Переменные-предикторы:
Это переменные, которые влияют на целевую переменную, хотя мы не знаем, какая из них более значима по сравнению с другими, или действительно, взаимодействуют ли две или более переменных вместе, чтобы оказать большее влияние.
Для набора Сбербанка у нас есть предикторные переменные из 3-х категорий:
- Сведения о недвижимости,
- Характеристики соседства,
- Макроэкономические факторы
(Обратите внимание, что все предикторы в ментальной карте, отмеченные знаком #, обозначают производные или вычисляемые переменные).
Сведения о собственности:
- Отметка времени –
- Мы будем использовать временную метку (д/м/г), а также извлекать значения месяца и года для оценки связи с телевизором.
- Мы также проверим, есть ли у какого-либо из домов несколько временных меток, что означает, что дом сменил нескольких владельцев.
- В домах на одну семью и в больших домах также есть внутренние дворики, дворы, чердаки и т. д., что создает разницу между жилой площадью и жилой площадью. Итак, мы берем соотношение между life_sq и full_sq и проверяем, получает ли дом с большим соотношением плюс большее full_sq лучшую цену.
- Kitch_sq – Дома с большими кухнями имеют лучшую цену? Итак, мы возьмем соотношение kitch_sq / life_sq и проверим влияние на цену дома.
- Sub_area — влияет ли это на цену?
- Год_сборки –
- По логике более новые дома должны иметь лучшую цену.
- Также проверьте, есть ли взаимодействие с full_sq, т.е. более крупные новые дома получают лучшую цену?
- Проверить взаимосвязь с sub_area.
- Материал — как это влияет на ТВ?
- Этаж/макс_этаж –
- создайте этот коэффициент и проверьте затронутую цену. Обратите внимание, нам необходимо определить, как идентифицируются дома на одну семью, поскольку их необходимо исключить как отдельное подмножество.
- Чем выше этаж, тем выше цена? В конкретной подобласти? Например, некоторые квартиры на верхних этажах в Чикаго и Нью-Йорке продаются по более выгодной цене, поскольку арендаторы получают потрясающий вид на горизонт, а количество недвижимости в таких районах ограничено.
- создайте этот коэффициент и проверьте затронутую цену. Обратите внимание, нам необходимо определить, как идентифицируются дома на одну семью, поскольку их необходимо исключить как отдельное подмножество.
- Product_type — инвестиции или собственность. Проверьте, есть ли у инвестиционной недвижимости лучшая цена.
Детали района:
- Full_all — общая численность населения в районе. Более плотная популяция должна коррелировать с более высокой продажной ценой.
- Male_f / female_f — производная переменная. Если соотношение искажено, оно может указывать на военные зоны или особые поселения, что может повлиять на цену.
- Соседство, дружественное к детям — рассчитайте соотношение x13_all / full_all, т. е. отношение общей численности населения до 13 лет к общей численности населения. Высокий коэффициент указывает на семейный район или жилой пригород, который может быть лучше с точки зрения цены продажи дома.
Также коррелируйте с sub_area.
- Аналогично предыдущему, рассчитайте соотношение подростков к общей численности населения. Соотнесите с sub_area.
- Близость к общественному транспорту: Рассчитайте нормализованные баллы для следующего:
- Железная дорога_stn_walk_min,
- Метро_мин_авто,
- Public_transport_walk
- Сложите все, чтобы получить взвешенную оценку. Мы надеемся, что более низкие значения должны коррелировать с более высокими ценами на жилье.
- Удобства для развлечений: легкий доступ к развлечениям должен быть выше в густонаселенных районах с более высоким уровнем жизни, и эти районы, по-видимому, должны иметь более высокую стоимость жилья. Следовательно, мы проверяем связь TV со следующими переменными:
- Фитнес_км,
- Бигмаркет_км
- Стадион_км,
- Торговый центр_км,
- Близость к офису: телевизор по сравнению с нормированными значениями для:
- Office_count_500,
- Office_count_1000,
- Логично предположить, что чем больше офисов поблизости, тем выше цена.
- Аналогичным образом рассчитайте нормализованные значения для числа производств поблизости, т. е. prom_part_500 / prom_part_5000. Однако здесь гипотеза состоит в том, что дома поблизости будут иметь более низкие цены продажи, поскольку промышленные предприятия приводят к шуму / загрязнению и не создают идеального жилого района. (необязательно, проверьте, есть ли в подрайонах с большим количеством промышленных предприятий меньшее количество отдельных домов (частные дома/таунхаусы и т. д.) 9.0036
Макропеременные:
Это общие цифры для всей страны, поэтому они остаются практически постоянными в течение всего года. Однако мы объединим эти переменные с обучающим и тестовым набором, чтобы получить более целостное представление о рынке недвижимости.
Причина проста: если общие процентные ставки по ипотечным кредитам чрезмерны (скажем, процентные ставки 35%), то маловероятно, что будет большое количество цен на жилье, что приведет к снижению общих цен продажи домов. Точно так же такие факторы, как инфляция, доход на человека, также влияют на цены на жилье.
- Соотношение Income_per_Cap и real_disposable_income: в идеале экономика развивается лучше, если оба числа высоки, что облегчает покупателям жилья получение ипотечных кредитов и, следовательно, поиск дома своей мечты.
- Mortgage_value: Мы будем использовать нормализованное значение, чтобы увидеть, насколько это число меняется с годами. Если число меньше, наша гипотеза состоит в том, что больше людей брали более крупные кредиты, и, следовательно, цены продажи за год должны быть выше.
- Usdrub: насколько хорошо курс рубля по отношению к доллару. Более высокие значения должны указывать на лучшую стабильность и экономичность, а также на более сильную корреляцию с телевидением.
(связь с евро мы пока проигнорируем). - Cpi: нормализованное значение по годам.
- ВВП: мы берем отношение gdp_annual_growth/gdp_annual, так как оба числа должны быть высокими в хорошей экономике.
- Коэффициент безработицы: Uзанятость/занятость. Гипотеза состоит в том, чтобы искать обратную связь с телевидением.
- Population_migration: Мы постараемся увидеть взаимодействие с телевидением, принимая во внимание sub_area.
- Museum_visits_per_100_cap: Получите значения, чтобы увидеть, увеличились или уменьшились числа по сравнению с предыдущим годом, указывая на более высокий/низкий располагаемый доход.
- Construction_value: нормализованное значение.
В следующих сообщениях мы будем использовать а) эти вопросы гипотезы, чтобы понять, как переменные влияют на целевую переменную. (b) Примените переменные в различных алгоритмах для расчета TV.
Встреча с Председателем правления Сбербанка Германом Грефом • Президентом России
Мероприятия
Рабочая встреча Владимира Путина с Председателем Правления Сбербанка, Председателем Правления Немецкий
Греф. Встреча касалась текущей деятельности банка, рынка ипотечного и потребительского кредитования.
13:20
Ново-Огарево Московской области
С Председателем Правления Сбербанка Германом Грефом.
Президент России Владимир Путин: Поговорим о текущей ситуации в банке и состоянии его кредитного портфеля.
Председатель Правления Сбербанка, Председатель Правления Герман Греф Греф ГерманПредседатель Правления, Председатель Правления Сбербанка: Господин Президент, мы достигли довольно хорошие результаты, несмотря на взлеты и падения последних нескольких месяцев. Естественно, на нас повлияло то, что он является крупнейшим держателем ценных бумаг, федеральных кредитные облигации, государственные ценные бумаги и, конечно, мы потеряли определенную сумму из-за этой волатильности.
Надеемся, что к концу года
ситуация стабилизируется, и мы возместим эти рыночные потери. Однако,
в последние месяцы на нашу чистую прибыль повлияли волатильность портфеля и нестабильные рынки.
Если вы посмотрите на самый большой и самый динамичная область, а именно жилищные кредиты, ипотека и жилищное финансирование, это вырос на 74 процента в годовом исчислении.
Генеральный директор Сбербанка, Председатель Правления Герман Греф.
Однако в прошлом году жилая кредитно-ипотечный портфель фактически удвоился по сравнению с 2016 годом и достиг 3,3 трлн руб.
Это рекордная цифра. У него было такого еще не было в истории нашей страны. В эти дни около 30 процент всего приобретаемого жилья финансируется за счет ипотечных кредитов.
Владимир Путин: Какая средняя процентная ставка по ипотеке в Сбербанке?
Герман Греф: Я думаю, что сейчас это чуть более 9 процентов.
Владимир Путин: Это средняя процентная ставка?
Герман Греф: Процентная ставка может быть ниже или выше. Старый портфель ипотечных кредитов также подвергается
постепенное рефинансирование. Конечно, у нас остались старые 12-процентные или 13-процентные кредиты.
Но сейчас мы их рефинансируем.
Ежегодно от 15 до 20 процентов старого ипотечного портфеля рефинансируется в соответствии с новыми процентными ставками. Поэтому я думаю, что со временем, в течение следующего года, мы значительно снизим среднюю процентную ставку вслед за снижением этих пиковых процентных ставок. ставки из старых ипотечных портфелей.
На встрече с Председателем Правления Сбербанка Германом Грефом.
Совершенно неожиданно автокредит портфель увеличился в этом году на 32 процента. Портфель кредитных карт тоже хорошо растет. Когда дело доходит до бизнес-кредитов в этом году, цифры хороший. В целом с начала года мы обеспечили 25 процентов больше кредитов.
Владимир Путин: Отлично.
Герман Греф: Это значительный результат. Мы не ожидали такого огромного увеличения.