Цифра- Научно-практический журнал

научно-практический интернет-журнал

Цифра №3

Цифра №2

Цифра №1

Новая реальность: цифровые двойники и искусственный интеллект

В эпоху становления цифровой экономики традиционные представления о числах и данных существенно изменились. Возникла даже целая отрасль науки о больших данных (Data Science). О новых понятиях и тенденциях в этой науке, а также ее связи с искусственным интеллектом, и роли научно-исследовательской лаборатории искусственного интеллекта в их развитии рассказала заместитель заведующего НИЛ ИИ ПГУТИ Оксана Захарова.

Большие числа – большие проблемы

Формального определения больших данных не существует. Более 60 лет назад один из крупнейших математиков ХХ века Андрей Колмогоров объяснил научному сообществу, что такое маленькие, средние и большие числа.

Вот один пример того, как появляются большие данные (Big Data). К электрической лампочке присоединено три выключателя, каждый из которых может находиться в левом или в правом положении. Существует восемь возможных вариантов совместных положений выключателей. Проводку к ним можно подвести таким образом, чтобы в каждом из восьми положений лампочка или горела, или не горела. Получится 256 возможных комбинаций. Если выключателей, допустим, пять, комбинаций будет уже 4 294 967 296. А если шесть, то число комбинаций превысит количество атомов во Вселенной.

А теперь представим, что на одну из лекций пришла тысяча человек, и лектор решил с каждым из них поздороваться за руку. При личном контакте он получит информацию о человеке (пол, примерный возраст, рост и т.д.), на основе которой можно определить, например, процентное соотношение мужчин и женщин, их средний возраст (в науке о данных это называется «разметкой данных»). Если же попросить всю тысячу присутствующих обменяться друг с другом рукопожатиями, то нашему мозгу не под силу будет сосчитать общее число контактов и тем более обработать в разы увеличившееся количество сведений. Получается, тысяча — это среднее число, потому что мы осознанно не можем проанализировать такое количество элементов.

Сверхсущность или обычная ЭВМ?

Человеческий мозг с легкостью может строить теории, делать выводы и принимать решения при малом наборе сведений. А вот большие объемы данных, и даже средние, люди уже не в силах проанализировать. Для этого и создан искусственный интеллект, который формально определяют как набор методов, алгоритмов, сред и технологий для обработки данных любого типа.

Цель обработки — составление всевозможных прогнозов, разработка классификаций, выявление аномалий, а также получение нового знания, обнаружение новых интересных закономерностей в данных. И компьютер с этим справится гораздо лучше человека. Но все же надо помнить, что у машины всегда есть вероятность, пусть и минимальной, погрешности. Поэтому слепо доверять ей не стоит.

Все мы знаем о существовании «трех китов» информатики: это данные, информация и знания. «Сырые» данные мы превращаем в информацию. А из нее, в свою очередь, извлекаем знания — неизвестные ранее сведения. С позиции искусственного интеллекта, информация — структурированные данные. А знания — структурированная информация. Сейчас ученые работают над автоматизацией процессов структуризации.

Однако популярность термина «искусственный интеллект» во многом объясняется его ошибочным толкованием, в частности, когда им обозначают некую искусственную сущность, наделенную разумом, которая якобы в состоянии конкурировать с людьми. Эта мысль из области древних легенд и преданий, звучащая как миф о Големе, с недавних пор реанимируется такими нашими современниками, как британский физик Стивен Хокинг (1942-2018 гг.), американский предприниматель Илон Маск и американский инженер Рэй Курцвейл, а также сторонниками создания так называемого сильного или общего ИИ.

Не будем, впрочем, говорить о данном понимании этого термина, ибо оно скорее представляет собой появившийся под влиянием научной фантастики продукт богатого воображения, а не осязаемую научную реальность, подтвержденную опытами и эмпирическими наблюдениями.

Сплели нейронные сети

Если говорить об ИИ, нельзя не упомянуть такое популярное в наше время понятие, как нейронные сети. Нейронные сети были придуманы лет 60 назад. Сегодня они стали основным инструментом глубокого обучения (Deep Learning) — методов машинного обучения, основанных на имитации работы человеческого мозга в процессе обработки данных. Мы знаем, что в нашем мозге есть нейроны (нервные клетки), соединенные друг с другом аксонами (длинными цилиндрическими отростками нервной клетки).

А нейронная сеть с точки зрения информатики — это математическая модель, в которой искусственные нейроны (простые процессоры) объединены в систему и взаимодействуют друг с другом. Так, каждый процессор периодически получает сигналы от других процессоров, а также посылает сигналы сам. И такая с виду простая сеть способна выполнять довольно сложные задачи.

Схема работы нейросети выглядит так: входные нейроны получают исходные данные, скрытые нейроны обрабатывают информацию, а выходные нейроны выводят готовый результат. Таким образом, в зависимости от характера задачи, определенное количество нейронов получает входные данные, а затем передает их на скрытый средний слой. Машина ищет закономерности среди огромного количества нейронных связей и «принимает» решение.

От физического тела — к цифровому двойнику

А что потом? Data Science уже начала менять наш мир. Мы никуда не денемся от цифровизации. Окружающие нас вещи будут постепенно лишаться физического тела и переходить в виртуальность под лозунгом: «Все, что может быть лишено физического тела, будет его лишено, превратившись в цифрового двойника».

Можно предположить, что в недалеком будущем после полной цифровизации геномов белковых тел, станет вероятным отправлять их цифровую копию по электронной почте. Кстати, уже сейчас наблюдается тенденция падения спроса на программистов, стали востребованы другие специалисты — компьютерные лингвисты, специалисты по машинному обучению, архитекторы виртуальности, аналитики Big Data. Особенно этот процесс будет ускоряться в связи с появлением ChatGPT.

ПГУТИ  создает кадры для цифровой экономики будущего

В России в последние два года сделан серьезный шаг вперед, совершен скачок и на уровне регионов, и на уровне правительства для того, чтобы создать условия для развития искусственного интеллекта практически во всех сферах. Сегодня явно виден растущий интерес к развитию и внедрению технологии искусственного интеллекта.

Поволжский государственный университет телекоммуникаций и информатики является одним из первых образовательных учреждений региона, которое оценило перспективы развития  данных технологий.

В январе 2020 года в ПГУТИ была создана Научно-исследовательская лаборатория искусственного интеллекта (НИЛ ИИ). Возглавил ее Сергей Левашкин, выпускник МГУ им. М.В. Ломоносова, ученый с более чем 20-летним опытом работы в университетах и компаниях России, Северной Америки и Европы.

В контексте национальной программы «Цифровая экономика РФ» и «Плана 2030», создание НИЛ ИИ является стратегическим проектом, поскольку наука о данных, искусственный интеллект и бизнес-интеллект являются ключевыми факторами цифровой трансформации экономики.

На сегодняшний день лаборатория занимает лидирующее положение в НИР и НИОКР университета по ИИ и решает самые разнообразные задачи, включая ведение научно-исследовательской работы в области науки о данных, искусственного интеллекта и машинного обучения, а также подготовку высококвалифицированных кадров для цифровой экономики.

Искусственный интеллект хорошо работает в интересах и на благо людей, если его создает и применяет грамотный, хорошо подготовленный человек.

Лаборатория обеспечивает содержанием факультатив и магистерскую программу «Наука о данных и искусственный интеллект», а также коммерческий курс «Бизнес-интеллект».

Студенческий курс содержит популярное введение в науку о больших данных и основные методы искусственного интеллекта для их обработки. Он мотивирует студентов старших курсов для поступления в магистратуру «Наука о данных и искусственный интеллект», но доступен также студентам младших курсов и самой широкой публике.

Коммерческий курс — введение в науку о больших данных и основные методы искусственного интеллекта для их обработки. Курс рассчитан на повышение цифровой грамотности управленцев, представителей коммерческих компаний и т.д. Содержит примеры приложений методов искусственного интеллекта в различных областях экономики, бизнеса, управления и т.д.

В 2022 году на базе НИЛ ИИ ПГУТИ впервые был осуществлен прием в магистратуру по профилю «Прикладной искусственный интеллект и наука о данных» по программе МГУ.

В рамках реализации программы осуществляется подготовка специалистов в области искусственного интеллекта и науки о данных, способных применять фундаментальные знания математических и естественных наук, программирования и информационных технологий при решении прикладных задач различного уровня сложности с целью удовлетворения потребностей промышленности, бизнеса и науки, муниципального и государственного управления, решения иных задач.

Активно ведется студенческая научная работа. Студенты и магистранты уже с самых ранних курсов обучения имеют возможность работать над реальными практическими задачами, осваивать новые компетенции в области искусственного интеллекта и науки о данных, принимая участие в научной и грантовой деятельности лаборатории.

Лаборатория активно ведет НИР и выигрывает различные гранты — от математического моделирования распространения вирусных заболеваний до разработки модулей для системы «Умные дороги».

Кроме того, лаборатория НИЛ ИИ входит в состав Рабочего комитета «Искусственный интеллект» НОЦ «Инженерия будущего» — это научно-образовательный центр, объединяющий науку и реальный сектор экономики. Основным направлением от ПГУТИ в области искусственного интеллекта является разработка инфокоммуникационных технологий на основе анализа BigData.  Куратор направления — заведующий лаборатории Сергей Левашкин.

В горизонте текущего десятилетия задача лаборатории — обеспечить массовое внедрение искусственного интеллекта. Оно должно охватить все отрасли экономики, социальной сферы и систему госуправления.

Научный поиск НИЛ ИИ ПГУТИ

  • Программное обеспечение формализации и извлечения знаний о сложных информационных объектах
  • Алгоритмы и программное обеспечение машинного обучения (machine learning)
  • Аналитическое программное обеспечение нового поколения (next-generation analytics)
  • Мультиязычные (инвариантные к исходным языкам) и мультимодальные (инвариантные к типу контента) системы извлечения и формализации информации (nlp)
  • Алгоритмы и программное обеспечение для формализации и извлечения знаний из слабоструктурированной и неструктурированной информации.
  • Математические модели распространения вирусных заболеваний и их исследование методами искусственного интеллекта
  • Семантико-ассоциативный анализ и синтез телекоммуникационных данных

Источник: Научно-исследовательская лаборатория искусственного интеллекта ПГУТИ

Реализованные гранты НИЛ ИИ ПГУТИ (2022 год)

  • «Вирусы I»: Многофакторное моделирование с применением технологий искусственного интеллекта структурно-динамического равновесия социально-экономической системы РФ при распространении пандемии (РФФИ/РНФ)
  • «Вирусы II»: Математическое моделирование распространения вирусных заболеваний (Минобраз/РосАтом)
  • «Умные дороги»: Разработка модуля интеллектуальной обработки данных системы мониторинга оптоволоконных сигналов (Haulmont).
  • «СМАРТ продукты»: Применение алгоритмов ИИ для компьютерного моделирования новых продуктов, товаров и услуг с заданными свойствами (Минцифры РФ).

Источник: Научно-исследовательская лаборатория искусственного интеллекта ПГУТИ

Ссылки: https://ai.psuti.ru/

https://t.me/laboratoria_psuti

https://vk.com/nil_ai_psuti

Автор выражает благодарность за помощь в подготовке статьи заведующему НИЛ ИИ Сергею Павловичу Левашкину.