Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
Гематологический центр (ГНЦ)
Сергей Куликов: «Никакие продвинутые методы анализа не могут снизить требований к качеству данных»

Выступая на конференции «Татьянин день» – элементы искусственного интеллекта в современной гематологии» кандидат технических наук, начальник информационно-аналитического отдела  НМИЦ Гематологии Минздрава России Сергей Куликов представил доклад  «Поиск генетических предикторов ответа на терапию заболеваний системы крови с использованием алгоритмов  машинного обучения».
 
Обращаясь к участникам конференции, Сергей Михайлович отметил, что цель его доклада - уберечь исследователей от ложных ожиданий чуда.
 
Спикер особо подчеркнул, что машинное обучение и искусственный интеллект, это разные вещи.

Была показала работа алгоритмов машинного обучения на примере хронического миелолейкоза, множественной миеломы, острого промиелоцитарного лейкоза, когда приходится сталкиваться с тем, что число признаков сравнимо или больше чем объем выборки.

В заключении отмечено, что в научных исследованиях часто возникает ситуация когда информации много, а объектов исследования мало. Этот конфликт заставляет искать новые алгоритмы.
Однако, несмотря на мощность новых инструментов анализа, это не освобождает от необходимости делать предобработку данных с целью сокращения размерности исходной информации.
 
– Чудес не бывает, дополнительно к методам МО нужно использовать биологические, математико-статистические модели, – отметил Сергей Михайлович. – Нужно делать попытку сокращения размерности и только потом использовать эти методы. Случайные леса по нашему мнению наиболее устойчивый и результативный инструмент машинного обучения. В основном он предназначен для поискового анализа. В последующим результаты его работы нужно проверять классическими методами биостатистики. Никакие продвинутые методы не снижают требования к качеству данных и репрезентативности обучающей выборки. Важно помнить, что мусор порождает мусор. Надо быть очень осторожным в практическом применении. Нельзя использовать машинное обучение, если машина не поясняет решение. Репозитории (библиотеки, архивы, коллекции) данных - фундамент и залог успеха использования машинного обучения  и искусственного интеллекта.

Подробнее на сайте НМИЦ гематологии Минздрава России https://blood.ru/about/novosti/sergey-kulikov-nikakie-prodvinutye-metody-analiza-ne-mogut-snizit-trebovaniy-k-kachestvu-dannykh/
Источник: https://vk.com/wall-207054843_2141
интересно
не интересно
интересно / не интересно

Новое сообщение