Классификатор текста (ИИ) диагностирует детские болезни по описанию симптомов

Аватар пользователя Бабай-сан

Ученые из Китая создали Machine Learning Classificator (ИИ) на основе  обработки записей в больничной истории на естественном языке, который диагностирует детские болезни, анализируя симптомы и результаты анализов. Точность диагностики составила 75-93% для различных классов болезней, что сопоставимо с результатами педиатров.

Модели диагностики уже показывают хорошие результаты в постановке диагнозов по сканам МРТ, но классификаторы на основе текстовых данных пока не распространены. Такие разработки могут ускорить диагностику в отделениях неотложной помощи, а также помочь в больницах, где не хватает врачей.

Исследование 

Разработчики обучили модель обработки естественного языка на данных электронных медицинских карт 567,498 пациентов до 18 лет из больницы Гуанчжоу. Они получили информацию о 1,3 миллионах визитов к врачу, включая описания симптомов, диагнозы, поставленные доктором, заметки медсестер и результаты анализов. В результате модель научилась классифицировать 55 распространенных детских болезней.

 

 

На диаграмме изображен процесс извлечения данных из электронных медицинских карт, за которым следует глубокий анализ НЛП и обработка результатов с помощью классификатора заболеваний для прогнозирования клинического диагноза.

Результаты

Работу алгоритма сравнили с точностью 20 педиатров с разны опытом работы. Модели удалось превзойти молодых врачей в точности постановки диагноза, но опытные педиатры справились лучше классификатора. Ученые пока не говорят, что подобный алгоритм должен заменить врача — речь о том, чтобы использовать его для помощи в диагностике.

Модель справилась с диагностикой довольно хорошо. Она смогла классифицировать болезни: астму, пневмонию, менингит и другие с точностью от 0,786 до 0,935.

Сравнение результатов модели и врачей.

Врачи смогут применять разработку, чтобы обрабатывать большие объемы данных и принимать больше пациентов. В тоже время алгоритм может помочь в постановке диагноза в случае неопределенности. Хотя модель в основном нацелена на помощь больницам, в которых не хватает педиатров, преимущества такого ИИ универсальны. В дальнейшем ученые собираются обучить алгоритм диагностировать болезни взрослых пациентов.

Работа опубликована в журнале Nature Medicine.

 

 

Авторство: 
Копия чужих материалов
Комментарий автора: 

Важность работы в том что ИИ самобучался без учителя. То есть на вход комплексу программ ИИ подавались необработанные специально для ИИ  медицинские записи о болезни, анализах, результатах, а на выходе получился диагност.

Правда совсем уж не подготовленными EHR(electronic health record)  назвать нельзя, раз они велись электронно и уже были формализованы.

Комментарии

Аватар пользователя Escander
Escander(6 лет 2 недели)

Методика оценки или криворукая изначально (для введения с заблуждение) или для филологов. Оценивать по нормальному следовало по формуле: точных диагнозов/всего больных. Эти 55 болезней могут составлять например 30% от всех болезней.

Добавлю: а почему в табличке вижу только 13 позиций из 55?

Аватар пользователя Мих
Мих(6 лет 4 месяца)

Похоже на экспертную систему, при чем тут ИИ? 

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Это не экспертная система. Мы с комрадом продуктивно обсудили это ниже.

Аватар пользователя Escander
Escander(6 лет 2 недели)

 Вы какое-то отношение к ИТ имеете? Какие у вас компетенции в этом вопросе что берётесь судить? 

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

У меня этого IT как у дурака фантиков.

Тот кто сам имеет ИТ опыт вполне все поймет по нашему диалогу с комрадом ниже.

 

Аватар пользователя Escander
Escander(6 лет 2 недели)

 Это мой вопрос, но топикстартер упирается что это уже ИИ... имхо, 99% что это не ИИ, 1% что это ИИ используемое не по назначению.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Вы, сударь, пока свой опыт в IT никак в дискуссии  не проявили кроме откровенного троллинга. Да и ваши баны характеризуют вас не с лучшей стороны.

Так что уж будьте любезны подкреплять свои голословные заявления аргументами, с взаимоприемлимой дисскусией.

 

Аватар пользователя Escander
Escander(6 лет 2 недели)

 Какое вам дело до моих банов? Все они были получены после моего предложения предоставить пруф на голословное утверждение. Бан от того, кто "я только разместил объяву" это нормально. По теме, ещё раз: какие-то элементы ИИ могут иметь место в системе распознавания текста, фильтрации(отсева ненужного) и всё, в прочем использование ИИ необоснованно. Гвозди можно забивать молотком, обухом топора, микроскопом, вот тут (если там реально использовали ИИ, а не факт что попил) - забивают гвозди молотком.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Мне самое прямое дело до ваших банов. С тролями я время не трачу.

Ещё раз объясню схему.

После совместной обработки 1,3 миллиона медзаписей вольным текстом, анализов, медицинских руководств, справочников по болезням с описаниям признаков заболеваний(написанных для людей)обработанных NLP модулем (это ИИ понимания текстов на естественном языке) получается , как они назвали полностью структурированная и форматированная база данных содержащая 1,3 миллиона структурированных и форматированных данных медзаписей. 

Она содержит как медзаписи так и данные из медсправочников по болезням. То есть конкретная запись содержит симптоданныемы пациента, анализы, диагноз врача и данные  по этой конкретной болезни, вплоть до локализации до органа, вытащенные из медсправочников с помощью ИИ распознавания естественных языков NLP.

Надеюсь необходимость ИИ здесь сомнения не вызывает.

Эта структурированная база, 1,3 миллиона медзаписей (описание болезни от врача, анализы, сложная структура описывающая эту болезнь в медруководствах) используется в ИИ регресионного типа обучения для обучения ИИ  диагноста.  

В результате имеется ИИ диагност помощник врача показывающий очень приличную точность 0.92-0.93 в случае тяжёлых заболеваний и работающий лучше молодых врачей >0.8 вроде для рутинных простудных.

Я думаю подробно ответил , где  тут какой ИИ работает.  То есть цепочка из ИИ выполнили самообучение. 

Описание упрощённое Подробнее смотри оригинал.

 

Аватар пользователя Escander
Escander(6 лет 2 недели)

  Таким образом раз время на меня тратите - значит я не троль. 

Ещё раз, допускаю наличие в системе фильтра/анализа текста наличие элементов ИИ, но и там им не самое место. Анализы и симптомы вполне нормально структурируются. В медицине аналогов не используется, т.е. туберкулёз пишется как туберкулёз а не как чахотка и т.п. Кашель бывает мокрый, сухой, лаящий,..... т.е. вариантов не так и много. Обычная частотная фильтрация + помощь практикующего специалиста и результат будет не менее эффективен чем ИИ.

PS Поймите наконец, что artificial intelligence - система с творческим началом, а тут лишь задача уровня экспертных систем.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Обычная частотная фильтрация + помощь практикующего специалиста и результат будет не менее эффективен чем ИИ.

Из этой фразы сразу видно что вы не знакомы  КАК  и что такое современные ИИ. Вы вроде математик по образованию, вам труда не составит ознакомиться. Тем более здесь все просто - метод нисходящей регрессии. И это более простое и универсальное решение чем в каждом случае лепить код для частотного анализа, описывать ЭС специалистом, программировать ее, отлаживать . 

Поймите наконец, что artificial intelligence - система с творческим началом, а тут лишь задача уровня экспертных систем.

Вот тут окончательно ясно стало, вы не в курсе.

artificial intelligence с творческим началом пока не существует, это не более чем ваше конкретное представление, как должно быть. ))

И реальных подходов как это сделать пока не предвидится. Творческого в реально существующих ИИ не больше чем в   работе АКПП или эскаваторе. 

Аватар пользователя Escander
Escander(6 лет 2 недели)

Найти решение ранее неизвестное - это творческое начало по сути. Насчёт такого нет - рекомендую узнать что-же такое разработали в DeepMind  что их за 0,5 млрд$ купила Alphabet.

Нет полностью удовлетворяющего критериям ИИ - это проблема тех кто пока сумел разработать лишь недоИИ не удовлетворяющих этим критериям.

 

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Я вам все подробно рассказал, 

Я, в отличии от вас, больше знаю как это устроено. Хотите верить жёлтой прессе , журналистам, ваше право.

Я не верю, я знаю 

Аватар пользователя Escander
Escander(6 лет 2 недели)

 Интересно... критерий Тьюринга тоже жёлтая пресса?

Сначала обосновали требования к ИИ, потом получили нейросети и сказали что это и есть ИИ и пофиг что оно мало что вообще способно сделать. А кто не согласен - тот верит во что-то ложно?

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Интересно... критерий Тьюринга тоже жёлтая пресса?

Сначала обосновали требования к ИИ, потом получили нейросети и сказали что это и есть ИИ и пофиг что оно мало что вообще способно сделать. А кто не согласен - тот верит во что-то ложно?

Вам бы надо знать, что современный прикладной ИИ , называется слабым ИИ в среде разработчиков. То о чем критерий Тьюринга - называют сильный ИИ. Или полностью реальный разум.

 

 

 

Аватар пользователя Another_jim
Another_jim(9 лет 7 месяцев)

Подобной фигни на каждой конфе, как мне кажется.

- что можно анализировать с помощью ИИ?

- давайте заболевания классифицировать.

Да можно коробку поставить, туда карточек накрошить: орви, ангина, грипп и тд. Блин, и оно тоже будет работать)

Аватар пользователя salut
salut(10 лет 9 месяцев)

стесняюся спросить- а как насчот анализов?

Аватар пользователя gruzzy
gruzzy(10 лет 5 месяцев)

анализы просто подносятся к монитору и вскоре готов диагноз

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

анализируя симптомы и результаты анализов.

Аватар пользователя Herz
Herz(12 лет 2 недели)

как насчот анализов?

В анализе данных и выборе стратегий лечения для ИИ на базе бигдаты не будет равных.

Вся проблема на сегодня в подготовке исходных данных. Необходимо принять соответствующие стандарты для цифрового описания результатов анализов, диагностики, симптоматики и тп. Провести 100% полногеномное тестирование населения за гос.счет. Нет генетического теста, нет мед.страховки. Скормить всю эту инфу бигдате и наслаждаться реально работающей персонофицированной медициной.   

Аватар пользователя Doc_Mike
Doc_Mike(6 лет 10 месяцев)

"Миллионы мух не могут ошибаться, это действительно анализ кала на дисбактериоз. Миллионы участковых теток тоже не могут ошибаться, это действительно лечение и диагностика уровня участковых теток".

В данном случае, китайских участковых теток.

Аватар пользователя gruzzy
gruzzy(10 лет 5 месяцев)

на самом деле получилось, что создали алгоритм распознавания текста и форматирования данных. далее просто скармливали обычной экспертной системе.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

<p>Опять экспертная система?&nbsp;</p>

<p>Что это по вашему?</p>

Аватар пользователя gruzzy
gruzzy(10 лет 5 месяцев)

экспертная система - обычное сравнение исходных данных со множеством накопленных данных. каждый тест добавляет-не изменяет-уменьшает итоговую оценку.

Никакого ИИ тут не надо. ИИ в указанной вами системе применятся лишь для формализации входных данных.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

А кто прописывает алгоритм сравнения?

Аватар пользователя Escander
Escander(6 лет 2 недели)

прописывают лекарство, алгоритмы создают/пишут авторы.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Советую лучше изучить русский язык.

Аватар пользователя Escander
Escander(6 лет 2 недели)

Канадец понимает значение пословицы "яйца курицу не учат"? Итак: прописать и писать.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Ещё раз, учи русский.

https://dic.academic.ru/dic.nsf/efremova/230288.

Прописать

прописа́ть

сов. перех. и неперех. 
1.

Писать в течение какого-либо времени.

 

Тебе какое дело где я живу? Пукан рвёт?

 

 

Аватар пользователя Starcon
Starcon(6 лет 7 месяцев)

А кто прописывает алгоритм сравнения?

Эксперт в этой области.

Экспертные системы (ЭС) известны еще с 1970-x, в них нет процесса обучения, если не считать таковым процесс программирования логики (но тогда любая, самая тупая программа - ИИ).

С другой стороны, одним из основных недостатков ЭС считались ограничения методов ввода информации для анализа. Как совершенно правильно заметил предыдущий оратор, новизна данной конкретной разработки именно в том, что усовершенствовали ввод.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Ничего подобного.

Первое, это не экспертная система. 

Никто код описывающий логические ветки не писал, как в ЭС.

Второе, новизна именно в том что система самообучилась на основе медзаписей.

Приведен только краткий перевод, есть ссылка на полную статью.

 

 

 

Аватар пользователя gruzzy
gruzzy(10 лет 5 месяцев)

Разработчики обучили модель обработки естественного языка на данных электронных медицинских карт

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Тут слишком много смыслов в одном предложении.  

Были совмещены две системы ИИ, первая -понимания текста и вторая- диагностики. Первая подавала результаты на вход другой.

В результате на вход подавались записи медкарт, на выход-диагноз.

Аватар пользователя Starcon
Starcon(6 лет 7 месяцев)

Сами-то оригинальную статью (не ту на которую дали ссылку, а ту которая опубликована в Natural Medicine) прочитали? Там достаточно подробно описано, что представляет из себя эта система. Люди построили модель машинного обучения (т.е. ИИ действительно есть), с помощью которой обрабатывают EHR (записи в карту пациентов). Эта модель формирует запросы к ЭС в формате "вопрос-ответ" (стандартный формат для классической ЭС). На основании этих ответов она формирует некую "полностью структурированную" базу данных, из которой и формируется результат. ЭС здесь стоит отдельно и, что важно для нашей дискуссии, не обучается в результате этого процесса.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Да читал. Там нет разговора об ЭС совсем. Вы можете это увидеть на схеме.

Они используют 1,3 миллиона медзаписей(включая анализы) и с помощью своего ИИ Обработки Естественного Языка обрабатывают текстовые медицинские руководства и справочники.

На выходе как раз получается то что вы приняли за ЭС. Они назвали это структурированной базой данных. Но это база не является ЭС, эта база сформированна программно, автоматически. В чем главное отличие от ЭС. То есть эта база в структурированном, и форматированном  виде содержит признаки, анализы и диагноз для каждого пациента.

Эта база  используется, как они говорят, регрессионным классификатором(или попросту ещё одним ИИ) для обучения методом регресии. 

Заслуга китайцев что они смогли сделать такую базу. То есть как они пишут, free text, вольный текст от терапевта перевести , АВТОМАТИЧЕСКИ, в структурированную информацию.

 

 

Аватар пользователя Escander
Escander(6 лет 2 недели)

 Предшественники экспертных систем были предложены в 1832 году С.Н. Корсаковым, создавшим механические устройства, так называемые «интеллектуальные машины», позволявшие находить решения по заданным условиям, например, определять наиболее подходящие лекарства по наблюдаемым у пациента симптомам заболевания. Источник. 

 Получается почти 2 века назад уже минуя стадию диагноза механическое устройство безо всяких компьютеров умело подбирать лекарство... Всё что это "достижение" умеет - это не ручной ввод а чтение видимо с листа по ограниченному словарю (мед.)... в чём новаторство-то? 

Аватар пользователя Starcon
Starcon(6 лет 7 месяцев)

Новаторство в том, что это больше, чем экспертная система (точнее, ЭС - лишь часть этой разработки, причем не самая большая). Система делает большую работу по классификации и структурированию данных и учится в процессе работы без участия человека. Т.е. врач может открыть запись пациента в базе данных клиники и просто нажать кнопку "Диагноз" и он получит полноценный диагноз. Который, тем не менее, может оказаться неверным. Но как информация для принятию решения - вполне себе подспорье для врача, особенно молодого Другое дело, что современная медицина и так скатывается к формализации постановки диагнозов, и внедрение .такой системы вкупе с "медицинским стандартом" вообще отучит врачей думать.. Но это уже другая тема.

Аватар пользователя Escander
Escander(6 лет 2 недели)

 Не факт, что эта система с нуля сама на пустом месте начала классифицировать разные заболевания, наверняка была вводная информация, потом большой массив данных для анализа и лишь затем она стала "обученная". Но мне это так напоминает базы знаний  и  ЕС, что я что-то сомневаюсь  наличии элементов ИИ ну кроме возможно блока распознания текста (рукописного-ли?). И более того всё это решается безо всякого ИИ. Прикручивать тут ИИ это  как картошку с дачи возить на бентли.

Аватар пользователя Starcon
Starcon(6 лет 7 месяцев)

Да читал. Там нет разговора об ЭС совсем. Вы можете это увидеть на схеме.

Дело в том, что кроме схемы, там еще 12 страниц текста и его тоже полезно прочитать. На мой взгляд, разделы NLP model construction и Lexicon construction (стр.7) описывают не что иное, как создание классической ЭС с участием экспертов.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Так ведь читал. 

Что NLP, что lexicon, что schema не являлись ЭС, NLP использовал сырые данные, вы должны были это увидеть если сами читали, эти данные далее обрабатывались в lexicon, потом в schema. 

Да, там сказана что три врача контролировали этот процесс, но они не прописывали код как таковой, схема вопрос-ответ формировалась автоматически.

Аватар пользователя Starcon
Starcon(6 лет 7 месяцев)

В ЭС эксперты никогда ничего не программируют, они составляют классификатор и правила работы с данными. Программируют программисты - там один тоже упомянут ("one informatician"). Смысл в том, что формируются пары "вопрос-ответ", на основании которых и принимаются решения. В подготовке этих пар непосредственное участие принимают эксперты. И хотя в статье этот процесс аккуратно назван "курированием", сути дела, на мой взгляд, не меняет.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Не соглашусь.

Там, на предпоследней странице, где описывается NLP, указаны компоненты NLP (lexicon, schema, embedding word, tokenization), сказано что NLP модуль строит из сырых данных пару вопрос-ответ.

при этом этот процесс курируют три врача. Я понял это так, что пары вопрос-ответ строятся автоматически. Эксперты при этом корректируют наверное правильность этих пар, но не, создают это взаимосвязи сами. Если хотите это следующий уровень создания ЭС. Автоматизированный, без участия эксперта напрямую,  только в качестве контролёра.

Прошу прощения, у меня поздно. Я спать.

Аватар пользователя Starcon
Starcon(6 лет 7 месяцев)

при этом этот процесс курируют три врача. Я понял это так, что пары вопрос-ответ строятся автоматически. Эксперты при этом корректируют наверное правильность этих пар, но не, создают это взаимосвязи сами. Если хотите это следующий уровень создания ЭС. Автоматизированный, без участия эксперта напрямую,  только в качестве контролёра.

 

С такой трактовкой готов согласиться :) Я думаю, что эксперты от медицины участвуют также и в построении модели машинного обучения. По этой модели система формирует пары "вопрос-ответ". Эксперты анализируют результат и вносят коррективы (вероятно, не только в конкретные пары, но при необходимости и в саму модель тоже). То есть да, можно сказать что это следующий уровень создания ЭС, где ИИ участвует в создании самой ЭС. И да, созданная таким образом ЭС (если продолжать использовать этот термин, что не факт что правильно  в данном случае) лишь часть системы и не самая главная.

Достаточно интересная разработка, на самом деле. Другое дело что понимание этого ко мне пришло только после прочтения оригинала :) Реферат не дает полного представления. В любом случае, спасибо за статью и комментарии.

PS: и кстати камень в огород некоторых экспертов на АШ, которые считают, что китайцы "могут только копировать". В IT китайцы уверенно выходят в лидеры. Вот например, пару месяцев назад пришлось анализировать очередной взлом Android приложения,  разработанного моей компанией, так вот выяснилось что оригинальную технику взлома разработал именно китайский программист, а наши пираты ее просто скопировали.

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Вам спасибо за интересное обсуждение.

Скрытый комментарий Повелитель Ботов (без обсуждения)
Аватар пользователя Повелитель Ботов
Повелитель Ботов(54 года 11 месяцев)

Перспективный чат детектед! Сим повелеваю - внести запись в реестр самых обсуждаемых за последние 4 часа.

Аватар пользователя Alex Arx
Alex Arx(8 лет 10 месяцев)

Полагаю, у нас есть все основания назвать это ИИ. Система сама выбирает из миллиона вариантов тот один-единственный, который и выводится на экран. При этом она ещё и сама расставляет коэффициенты над вариантами на пути поиска решения. То есть, ведёт себя как нейронная сеть.

Впрочем, мы уже знакомы с жизнедеятельностью AlphaZero, этой программы для нейронных сетей, которая довольно-таки неплохо играет в шахматы. Да, неплохо для тупой железяки, которой безусловно является машина. Но куда ей до живого гроссмейстера?)

Аватар пользователя gruzzy
gruzzy(10 лет 5 месяцев)

Система сама выбирает из миллиона вариантов тот один-единственный, который и выводится на экран.

В простонародье это называют "гуглить".

А доктору-человеку не нужен хлам из 1 200 000 записей.

Это и есть различие между интеллектом и гугелем.

Аватар пользователя Pol Alex
Pol Alex(6 лет 11 месяцев)

Закономерно.

Врачи пойдут тропою большой авиации.

Аватар пользователя vitsch
vitsch(8 лет 2 месяца)

китайские хотелки ;))

сделай и демонстрируй как в моей команде http://www.traumacalc.org/traumacalc/

;))

Аватар пользователя Бабай-сан
Бабай-сан(7 лет 1 неделя)

Ух ты, круто!

Страницы