Источники больших данных в медицине
Оглавление:
- Клинические информационные системы
- Данные претензий от плательщиков
- Научные исследования
- Генетические базы данных
- Публичные записи
- Поиски в Интернете
- Социальные медиа
- Интернет вещей (IoT)
- Финансовые операции
- Этические и конфиденциальные последствия
Большие данные в медицине. Врач и большие данные (Ноябрь 2024)
Простое определение больших данных в медицине - это «совокупность данных, относящихся к здравоохранению и благополучию пациентов» (Raghupathi 2014). Но что именно представляют собой эти типы данных и откуда они берутся?
Ниже представлен широкий обзор типов и источников больших данных, представляющих интерес для поставщиков медицинских услуг, исследователей, плательщиков, политиков и промышленности. Эти категории не являются взаимоисключающими, поскольку одни и те же данные могут поступать из различных источников.
И этот список не является исчерпывающим, поскольку практическое применение анализа больших данных, безусловно, будет расширяться.
Клинические информационные системы
Это традиционные источники клинических данных, которые медработники привыкли просматривать.
- Электронные медицинские записи (EHR) собирают, хранят и отображают такую информацию, как демография, история болезни, активные медицинские проблемы, иммунизация, аллергия, лекарства, показатели жизненно важных функций, результаты лабораторных и радиологических тестов, отчеты о патологии, заметки о прогрессе, созданные в сфере здравоохранения. поставщики и административные и финансовые документы
- Электронные медицинские записи (EMR) не идентичны EHR и обычно относятся к данным, хранящимся у конкретного врача.
- Обмен информацией о здоровье служит центром между разрозненными клиническими информационными системами
- Реестры пациентов, которые ведутся медицинскими организациями для их собственных пациентов, часто связаны с ЭМК. Другие реестры отслеживают иммунизацию, рак, травмы и другие проблемы общественного здравоохранения в более широком географическом масштабе.
- Порталы о пациентах позволяют пациентам получать доступ к личной медицинской информации, хранящейся в EHR организации здравоохранения. Некоторые порталы для пациентов также позволяют пользователям запрашивать пополнение рецепта и обмениваться безопасными электронными сообщениями с командой здравоохранения.
- Хранилища клинических данных объединяют данные на уровне пациентов из нескольких клинических информационных систем, таких как ЭМК и другие источники, перечисленные выше.
Данные претензий от плательщиков
Государственные плательщики (например, Medicare) и частные плательщики имеют большие хранилища данных о претензиях своих бенефициаров. Некоторые страховщики здоровья теперь также предлагают стимулы для обмена вашими медицинскими данными.
Научные исследования
Базы данных исследований содержат информацию об участниках исследований, экспериментальных методах лечения и клинических результатах. Крупные исследования обычно финансируются фармацевтическими компаниями или государственными учреждениями. Применение персонализированной медицины заключается в подборе индивидуальным пациентам эффективных методов лечения, основанных на данных клинических испытаний.
Этот подход выходит за рамки применения принципов доказательной медицины, с помощью которых поставщик медицинских услуг определяет, разделяет ли пациент общие характеристики (например, возраст, пол, раса, клиническое состояние) с участниками испытания.С помощью анализа больших данных можно выбрать лечение на основе гораздо более детальной информации, такой как генетический профиль рака пациента (см. Ниже).
Системы поддержки принятия клинических решений (CDSS) также быстро развиваются и в настоящее время представляют большую часть искусственного интеллекта (ИИ) в медицине. Они используют данные пациентов, чтобы помочь клиницистам принимать решения, и их часто объединяют с ЭМК.
Генетические базы данных
Хранилище генетической информации человека продолжает накапливаться быстрыми темпами. Со времени завершения проекта «Геном человека» в 2003 году стоимость секвенирования ДНК человека была снижена в миллион раз. Проект «Персональный геном» (PGP), начатый в 2005 году Гарвардской медицинской школой, призван упорядочить и опубликовать полные геномы 100 000 добровольцев со всего мира. Сам PGP является ярким примером проекта больших данных из-за огромного объема и разнообразия данных. Персональный геном содержит около 100 гигабайт данных. Помимо секвенирования геномов, PGP также собирает данные из EHR, опросов и профилей микробиомов.
Ряд компаний предлагают коммерческие генетические последовательности для здоровья, личных качеств и фармакогенетики.
Эта личная информация может быть подчинена аналитике больших данных. Например, 23andMe прекратило предлагать генетические отчеты, связанные со здоровьем, новым клиентам с 22 ноября 2013 г. в соответствии с Управлением по контролю за продуктами и лекарствами США. Однако в 2015 году компания снова начала предлагать определенные медицинские компоненты своего генетического теста на слюну, на этот раз с одобрения FDA.
Публичные записи
Правительство ведет подробный учет событий, связанных со здоровьем, таких как иммиграция, брак, рождение и смерть. Перепись населения США собирает огромное количество информации каждые 10 лет с 1790 года. На статистическом веб-сайте переписи населения по состоянию на 2013 год было 370 миллиардов ячеек, и примерно на 11 миллиардов добавлялось ежегодно.
Поиски в Интернете
Информация о веб-поиске, собранная Google и другими провайдерами веб-поиска, может предоставить информацию о состоянии здоровья населения в режиме реального времени. Однако ценность больших данных из шаблонов веб-поиска может быть повышена за счет объединения их с традиционными источниками данных о состоянии здоровья.
Социальные медиа
Facebook, Twitter и другие социальные медиа-платформы круглосуточно генерируют разнообразные данные, позволяющие оценить местоположение, поведение в отношении здоровья, эмоции и социальные взаимодействия пользователей. Применение больших данных в социальных сетях к общественному здравоохранению называется цифровым обнаружением заболеваний или цифровой эпидемиологией. Например, Twitter использовался для анализа эпидемий гриппа среди населения в целом.
Проект World Well-благополучия, который начался в Университете Пенсильвании, является еще одним примером изучения социальных сетей для лучшего понимания опыта и здоровья людей. Проект объединяет психологов, статистиков и компьютерных ученых, которые анализируют язык, используемый при взаимодействии в Интернете, например, при написании обновлений статуса в Facebook и Twitter. Ученые наблюдают за тем, как язык пользователей соотносится с их здоровьем и счастьем. Достижения в области обработки естественного языка и машинного обучения помогают в их усилиях. В недавней публикации из Университета Пенсильвании были рассмотрены способы прогнозирования психических заболеваний путем анализа социальных сетей. Похоже, что симптомы депрессии и других психических расстройств можно обнаружить, изучая наше использование Интернета. Ученые надеются, что в будущем эти методы смогут лучше выявлять и помогать лицам, которым грозит риск.
Интернет вещей (IoT)
Огромное количество информации, связанной со здоровьем, также собирается и хранится на мобильных и домашних устройствах.
- Смартфоны. Тысячи приложений mHealth собирают информацию о физической активности пользователя, потреблении пищи, типах сна, эмоциях и других параметрах. Собственные приложения для сотовых телефонов (например, GPS, электронная почта, текстовые сообщения) также могут дать подсказки о состоянии здоровья человека.
- Носимые мониторы и устройства. Шагометры, акселерометры, очки, часы и чипы, встроенные в кожу, также собирают информацию, связанную со здоровьем, и могут также отправлять их в облако.
- Телемедицинские устройства позволяют медицинским работникам контролировать параметры пациентов, такие как артериальное давление, частота сердечных сокращений, частота дыхания, оксигенация, температура, отслеживание ЭКГ и вес.
Финансовые операции
Операции с кредитными картами пациентов включены в прогностические модели, используемые системой Carolinas HealthCare System для выявления пациентов с высоким риском повторной госпитализации. Медицинский работник из Шарлотты использует большие данные для разделения пациентов на различные группы, например, в зависимости от заболевания и географического положения.
Этические и конфиденциальные последствия
Необходимо подчеркнуть, что в некоторых случаях могут быть важные этические последствия и последствия для конфиденциальности при сборе и получении данных в сфере здравоохранения. Новые источники больших данных могут улучшить наше понимание того, что влияет на здоровье людей и населения, однако необходимо тщательно рассмотреть и контролировать различные риски. В настоящее время также признано, что данные, ранее считавшиеся анонимными, могут быть повторно идентифицированы. Например, профессор Латинской Суини из лаборатории конфиденциальности данных Гарварда проверил 1130 добровольцев, участвующих в проекте «Личный геном». Она и ее команда смогли правильно назвать 42 процента участников на основе информации, которой они поделились (почтовый индекс, дата рождения, пол). Эти знания могут повысить нашу осведомленность о потенциальных рисках и помочь нам принимать лучшие решения по обмену данными.
Статистика одного родителя на основе данных переписи
Статистические данные по одиноким родителям из Бюро переписей США рисуют удивительный портрет, разрушая многие стереотипы.
Обратная сторона взрыва доступных медицинских данных
Учитывая все позитивные изменения, касающиеся цифрового здравоохранения, в настоящее время возникают вопросы, которые необходимо решить в отношении данных о здоровье и конфиденциальности.
Растущая важность совместимости данных о здоровье
Получение и обмен данными пациентов жизненно важны для качественного и эффективного ухода, особенно когда речь идет о пациентах с сопутствующими заболеваниями.