Как узбекский математик стал исследователем AI Safety в Стэнфорде

В нашем новом материале рассказываем, как Абдумалик из Узбекистана теперь создает безопасные ИИ системы в Стэнфорде.

Абдумалик Абдукаюмов, город — Пало-Альто, PhD Student at Stanford University, Instagram

О себе

Я из Узбекистана, учился в Международной математической школе в Каракуле, а затем изучал экономику и финансы в Ташкентском государственном экономическом университете. В Ташкенте я посвящал большую часть времени научным исследованиям в области теории вероятностей. Три года назад я переехал в США и получил степень магистра по экономике и IT в Университете Дьюка. В настоящее время я студент первого курса PhD в Стэнфордском университете. Мои исследовательские интересы — это оптимизация, машинное обучение, а также вопросы AI Alignment и AI Safety.

Как пришел в сферу AI Research

В Университете Дьюка у меня появилась возможность заняться исследованиями в области машинного обучения и статистики. Я понял, что могу использовать свой бэкграунд для повышения эффективности AI-моделей и решения сложных задач. Поскольку мои исследовательские интересы сосредоточены на оптимизации, я естественным образом пришел к этой теме и к сфере AI Research, где эффективность алгоритмов играет ключевую роль.

Моя исследовательская карьера началась с сильной математической базы. Когда я участвовал в Международных математических олимпиадах, нашими главными спонсорами были такие компании, как Jane Street и другие ведущие финансовые фирмы. Они часто нанимают победителей олимпиад. К сожалению, в Узбекистане у нас не было возможности работать там напрямую. Поэтому мы с другом основали собственный хедж-фонд, где я занял позицию ведущего количественного исследователя. Благодаря моему предыдущему опыту исследований в области теории вероятностей, я успешно справлялся с этой ролью. Мы разрабатывали алгоритмы и решали сложные задачи оптимизации. К сожалению, мы закрыли фонд в 2022 году, и незадолго до начала моей магистерской программы в Дьюке я успел пройти стажировку в Центральном банке Узбекистана в Департаменте финансовой стабильности. Именно этот прикладной и чистый исследовательский опыт подтолкнул меня к более глубокому погружению в научные исследования.

Я выбрал Stanford GSB, потому что это уникальное место, где сочетаются строгие академические исследования и непосредственная близость к Кремниевой долине. Моя программа — PhD в области Operations, Information and Technology, идеально подходит для моих целей. Во-первых, OIT позволяет заниматься глубокими теоретическими исследованиями в области оптимизации и стохастических моделей, которые являются фундаментом для обучения с подкреплением и безопасности ИИ. Во-вторых, Стэнфорд поощряет междисциплинарный подход, что дает мне возможность сотрудничать с экспертами из департамента Computer Science и центра Stanford HAI. Кроме того, близость к лидерам индустрии позволяет не просто развивать теорию, но и работать над прикладными задачами AI Alignment в реальном времени. Для меня важно, чтобы мои исследования имели практический выход и помогали делать системы искусственного интеллекта более надежными и безопасными.

Как проходил отбор на PhD программу 

Процесс отбора в Стэнфорд чрезвычайно конкурентный. В этом году в мою группу OIT на PhD программу приняли всего трех человек. Для поступления на такое направление критически важно иметь сильную математическую базу. В моем случае, я считаю, огромным преимуществом стали мои медали на Международных математических олимпиадах, которые я завоевал еще в школе и университете. Это послужило доказательством того, что я обладаю необходимым аналитическим мышлением для проведения сложных исследований. Кроме того, для PhD программ мирового уровня решающее значение имеет опыт исследовательской работы. До поступления я тесно сотрудничал с профессором Yehua Wei в школе бизнеса Фукуа . Моя работа была сосредоточена на алгоритмах оптимизации и обучения, в частности на расширении многомерных неравенств пророка. Этот опыт позволил мне показать приемной комиссии, что я уже готов к самостоятельной научной деятельности. С учетом того, что процент зачисления в Stanford GSB составляет менее 5%, сочетание олимпиадного прошлого и реальных академических публикаций стало моим ключом к успеху.


Моя подготовка в области экономики и алгоритмической теории игр является одним из моих главных преимуществ в исследованиях ИИ, особенно в таких направлениях, как AI Alignment и AI Safety. Во-первых, проблема AI Alignment по своей сути является задачей дизайна механизмов. Мы пытаемся спроектировать такие стимулы и функции вознаграждения, чтобы поведение ИИ-агента соответствовало человеческим ценностям. Теория игр предоставляет строгий математический аппарат для моделирования этих взаимодействий. Во-вторых, современные методы ИИ, особенно обучение с подкреплением, строятся на тех же фундаментальных принципах, что и математическая экономика: на оптимизации и стохастических процессах. Мой опыт работы с неравенствами пророка и границами регрета напрямую применим к анализу эффективности и надежности алгоритмов обучения. Наконец, когда мы рассматриваем системы со множеством автономных агентов, теория игр становится единственным способом предсказать и стабилизировать их поведение, чтобы избежать непредсказуемых или опасных последствий. Мой междисциплинарный бэкграунд позволяет мне смотреть на проблемы безопасности ИИ не просто как на инженерную задачу, а как на сложную систему стимулов и стратегических решений.

Трудности

Переход из области теоретической математики и экономики в технический AI был интересным вызовом. Я бы выделил две основные сложности. Во-первых, это переход от «доказательного» мышления к «экспериментальному». В математике мы привыкли работать в рамках строгих доказательств: если теорема доказана, она верна всегда. В глубоком обучении и RL теория часто идет вслед за практикой. Мне пришлось научиться работать в условиях, когда нужно проводить множество экспериментов, настраивать гиперпараметры и анализировать эмпирические результаты, которые не всегда поддаются мгновенному теоретическому объяснению. Во-вторых, это инженерная составляющая. Хотя у меня была база в программировании, современный AI требует глубокого владения специфическим стеком: PyTorch, работа с GPU-вычислениями и эффективная реализация сложных алгоритмов оптимизации. Однако мой опыт участия в математических олимпиадах очень помог мне. Олимпиадная база приучила меня быстро разбираться в новых абстрактных структурах и находить нестандартные решения. Благодаря этому я смог быстро освоить необходимые инструменты и сосредоточиться на главном — на том, как мои знания в оптимизации могут улучшить безопасность и надежность ИИ-систем.

В научной работе тупики неизбежны — это часть процесса поиска новых знаний. Когда я захожу в исследовательский тупик, я использую несколько проверенных подходов:

  1. Мой олимпиадный опыт научил меня, что если задача не решается долгое время, возможно, я сделал ложное допущение в самом начале. Я стараюсь упростить модель до базового уровня и проверить, работают ли мои идеи на самом элементарном примере.
  2. Одно из главных преимуществ обучения в Стэнфорде — это доступ к выдающимся экспертам. Я часто обсуждаю свои сложности с коллегами или научным руководителем. Иногда взгляд со стороны помогает увидеть то, что я упускал из виду из-за глубокого погружения в детали.
  3. Если я чувствую, что «зациклился», я временно переключаюсь на другую задачу — например, на программирование или чтение литературы по смежной теме. Часто решение приходит именно в момент такой интеллектуальной паузы.
  4. Я записываю, почему тот или иной путь не сработал. В исследованиях отрицательный результат — это тоже результат. Это помогает мне систематизировать процесс и не повторять одних и тех же ошибок в будущем.

Такой подход позволяет сохранять мотивацию и превращать каждую трудность в ступеньку к верному решению.

Одной из самых серьезных технических задач, над которой я работал, было исследование в Университете Дьюка совместно с профессором Yehua Wei. Мы занимались расширением многомерных неравенств пророка для сложных сценариев принятия решений. Основная техническая сложность заключалась в «проклятии размерности». В многомерных настройках количество ограничений в задаче оптимизации обычно растет экспоненциально, что делает стандартные методы вычислений практически бесполезными. Моей задачей было найти способ сделать эту модель вычислительно эффективной, не теряя в точности. Чтобы решить эту проблему, я разработал формулировку линейного программирования с полиномиальным числом ограничений вместо экспоненциального. Это потребовало глубокого применения аппарата стохастического моделирования и комбинаторной оптимизации. В результате нам удалось доказать новые границы регрета для алгоритмов обучения. Этот опыт был крайне важен для моей текущей работы в области AI Safety: он научил меня тому, что безопасность и надежность систем ИИ начинаются с математически доказуемых гарантий поведения алгоритма, особенно в условиях высокой неопределенности

Рекомендации

Основываясь на моем опыте перехода из чистой математики в исследования безопасности ИИ, я бы дал три главных совета:

  1. Укрепляйте математический фундамент. AI Safety — это не только философия, это строгая техническая дисциплина. Глубокое понимание теории вероятностей, оптимизации и стохастических процессов — это база, которая позволит вам не просто использовать существующие модели, но и создавать новые методы проверки их безопасности. Мой олимпиадный бэкграунд не раз выручал меня при решении задач, где стандартные методы не работали.
  2. Изучайте теорию игр и экономику стимулов. Проблема Alignment  — это во многом задача о том, как заставить систему преследовать цели, которые мы в нее заложили, избегая «взлома вознаграждения». Знания в области теории игр помогут вам лучше понять, как проектировать функции вознаграждения и анализировать поведение агентов в сложных средах.
  3. Не бойтесь междисциплинарности и раннего участия в исследованиях. AI Safety требует идей из самых разных областей — от компьютерных наук до политической экономии. Ищите возможности работать над реальными проектами с профессорами или в исследовательских лабораториях. Практика работы над реальной статьей или алгоритмом учит гораздо большему, чем просто чтение литературы.

Помните, что эта область еще молода, и именно сейчас у вас есть шанс внести вклад в то, каким будет будущее человечества в эпоху суперинтеллекта.