
Maharana & Nsoesie / Health Information, 2018
Американские исследователи обучили сверточную нейросеть классифицировать спутниковые снимки местности по наличию на них зданий, дорог, растительности и водоемов, и предсказывать на основе этих данных уровень ожирения жителей. Метод показал свою эффективность: характеристики антропогенной среды могут предсказывать до 64,8 процента различий в количестве людей с избыточным весом. Исследование опубликовано в журнале Health Informatics.
Ожирение провоцирует множество заболеваний. К примеру, избыточный вес может повысить шансы развития рака толстой кишки, ожирение в младенчестве ухудшает когнитивные способности в детстве, а также снижает эффективность прививки от гриппа во взрослом возрасте. Число людей с высоким риском развития ожирения растет с каждым годом: за последние сорок лет число детей с лишним весом выросло в десять раз.
Увеличивают риск развития ожирения, в основном, два фактора: неправильное питание и недостаточная физическая активность. На них, в свою очередь, влияет антропогенная среда — доступность определенных благ цивилизации: парков и аллей для прогулок, ресторанов быстрого питания, а также общественного транспорта. Тем не менее, исследования, сосредоточенные на связи окружения и ожирения обычно неполны из-за недостатка необходимых данных или способов анализа.
Изучить эту взаимосвязь решили Адяша Махарана (Adyasha Maharana) и Элейн Оканьене Нзоези (Elaine Okanyene Nsoesie) из Вашингтонского университета. Для этого они взяли примерно 150 тысяч изображений местности Google Static Maps API — сервиса, который предоставляет фотографии со спутника в высоком разрешении. Сосредоточиться ученые решили на четырех городах США: Лос-Анджелесе (Калифорния), Мемфисе (Теннесси), Сан-Антонио (Техас) и Сиэтле (Вашингтон). Для анализа изображений они натренировали сверточную нейросеть, архитектура которой хорошо подходит для анализа изображений. С помощью нейросети детали на изображении классифицировали на четыре группы: здания, дороги, озелененные места и водные поверхности. Все города разделили на примерно 1695 районов в зависимости от количества объектов каждой из четырех групп.

Выделение областей зданий (красным), озеленений (зеленым), воды (синим) и дорог (серым)
Затем полученные данные использовали для того, чтобы провести корреляцию с реальными данными о задокументированных случаях ожирения в каждом из городов: ученые собрали данные о людях с индексом массы тела от 30 кг/м2 и выше. Ученые выяснили, что различия в антропогенной среде каждого района объясняют примерно 64,8 процента различий в доле людей с ожирением.

Реальный (слева) и предсказанный (справа) уровень ожирения в Сиэтле и Лос-Анджелесе

Реальный (слева) и предсказанный (справа) уровень ожирения в Мемфисе и Сан-Антонио
Исследователям также удалось выделить признаки, характеризующие районы с высоким и низким уровнем ожирения жителей. Так, в более зеленых и водных областях, а также в центре города людей с избыточным весом оказалось меньше, чем в менее застроенных пригородах.

Примеры районов Сиэтла с высоким (слева) и низким (справа) уровнем ожирения
Авторам, таким образом, удалось показать эффективность использования автоматического анализа изображений с помощью сверточной нейросети для предсказания ожирения у жителей определенных местностей. Ученые также отметили, что предложенный ими метод объясняет предрасположенность людей, живущих в определенном районе, к ожирению лучше, чем данные о наличии в нем спортзалов и ресторанов быстрого питания.
Journal information