Нейронные сети. Пугающий пример

[Без понимания того, что такое нейросеть, нам, наверное, с наукой и философией удовлетворительно разобратся не удастся. Мы рассмотрели только один из языков науки — язык формальной теории. Нам известны (кибернетиками созданы) еще несколько языков, эквивалентных языкам формальных теорий. Это язык теории автоматов, языки программирования, язык нейронных сетей. Все, что может быть выражено в форме алгоритма, может быть высказано машиной Тьюринга. При этом сама машина может быть как полностью выполнена в «железе» (как «Искра-1256»), так и в программе (но все равно некоторый минимум «железа» необходим, чтобы программа имела возможность овеществлять свои результаты).

Здесь мы немного познакомимся с нейросетями, поскольку они, на мой взгляд, весьма адекватно отражают работу мозга как животного, так и человека или машины. Нейросети человека, кита и таракана устроены одинаково, разница в операционной системе, управляющей ими.

Статья взята из блога  Артема Краснова. Стихи и цитаты из Электрибальда добавлены мной.

 Общекотовичарохристофорная хрящетворобка.

— МИБ.]

Лопотуй голомозый, да бундет грывчато
В кочь турмельной бычахе, что коздрой уснит,
Окошел бы назакрочь, высвиря глазята,
А порсаки корсливые вычат намрыд!

В 2016 году искусственный интеллект AlphaGo обыграл лучшего игрока в го Ли Седоля со счетом 4-1. Сама по себе игра го считалась неподходящей для машинной логики, поэтому компьютер одолел человека значительно позже, чем в шахматы, где машины превзошли лучших из хомо сапиенсов 20 лет назад. Но пугает не это. 

Как известно, нейронные сети обучаются на примерах, скажем, чтобы они распознавали человеческие лица, им «показывают» огромное количество фотографий (которые берутся в том числе с наших юзерпиков в соцсетях). Примерно также обучался интеллект AlphaGo — на огромном массиве партий, в которых человек играл против человека.

В прошлом году вышла новая версия программы AlphaGo Zero, которая не использовала человеческий опыт. Она обучалась с нуля, играя против себя. Нейронной сети «объяснили» правила игры в го и больше ничего.

Короче, она начала играть сама против себя. За победу нейронная сеть получала «награду», то есть у нее был математический аналог нашего чувства триумфа, к максимизации которого система стремилась. Сначала сеть делала случайные ходы, примерно как играл бы двухлетний ребенок. Затем она анализировала ситуацию и обучалась, усложняя связи между узлами нейронной сети.

Результат? Через три дня такой практики версия Zero обыграла первую, обученную человеком, сеть AlphaGo Lee в 100 партиях из 100. Ту самую программу, которая победила Ли Седоля.

Через 21 день обучения AlphaGo Zero достигла уровня модифицированной версии AlphaGo Masters, которая победила 60 лучших игроков в го, включая Ли Седоля — последнего в трех партиях из трех. Еще через 40 дней Zero была признана лучшим игроком в го из когда-либо существовавших.

— Пусть сочинит стихотворение о кибэротике! — сказал он наконец, радостно усмехаясь. — Пусть там будет не больше шести строк, а в них о любви и измене, о музыке, о неграх, о высшем обществе, о несчастье, о кровосмесительстве — в рифму и чтобы все слова были только на букву К!
— А полного изложения общей теории бесконечных автоматов ты случайно не предложишь? — заорал оскорбленный до глубины души Трурль. — Нельзя же ставить таких кретинских усло…
И не договорил, потому что сладкий баритон, заполнив собой весь зал, в этот момент отозвался:

Кот, каверзник коварный, кибэротоман,
К королеве кафров крадется Киприан.
Как клавесина клавишей, корсажа касается.
Красотка к кавалеру, конфузясь, кидается…
…Казнится краля, киснет: канул Купидон,
К кузине королевы крадется киберон!

Интересно, что обучение было нелинейным, например, в отличие от человека, программа иногда осваивала сложные комбинации быстрее, чем простые. В конечном итоге она сама разработала ряд неизвестных ранее тактических схем, которые сейчас изучают профессионалы го, почесывая свои резко обесценившиеся репы.

Но го, повторюсь, является довольно сложной игрой для искусственного интеллекта. Что до шахмат, то за четыре часа (!) самообучения   AlphaZero   победила компьютерную программу Stockfish 8, которая отличалась одним из самых высоких уровней мастерства.

Счет, правда, был не совсем сухой — 25 побед белыми, 3 победы черными, остальные ничьи (при таком уровне игроков право первого хода имеет важное значение). Причем если Stockfish 8 вынуждена анализировать порядка 70 млн комбинаций в секунду, то более гибкий алгоритм нейронной сети выбирает из 80 тысяч.

Еще более разгромным было преимущество «альфы» в игре сёги — японском аналоге шахмат: здесь нейронная сеть одолела программу Elmo со счетом 90:8, две игры в ничью.

Сам по себе факт компьютерного превосходства в логических играх не вызывает удивления, ведь программа способна синтезировать качества лучших игроков за минусом волнения и человеческого фактора. Но ладно бы это был именно синтез того, что дал человек — такой подход оставляет возможность намеренно «недодать», чтобы обеспечить себе хотя бы теоретическое преимущество. Но самообучающийся интеллект выглядит зловеще как минимум потому, что мы не видим реального предела его возможностей: чему научится AlphaZero через год эмуляций?

Впрочем, логические игры все же являются абстракциями, удобными для искусственного интеллекта. Черная пешка не может подкупить белого слона, а ферзь не перестанет ходить по прямой из-за смерти любимого коня. «Жизненный интеллект» требует гораздо большего разнообразия и гибкости.

И поэтому активно идут работы над универсальным искусственным интеллектом, который, в отличие от узкоспециализированных, способен решить любую интеллектуальную задачу.

И вот здесь нас ждет еще несколько сюрпризов. К примеру, популярная игра GTA5 используется для обучения роботов-водителей. На первый взгляд, идея выглядит бредовой, тем более, «гэ-тэ-а» поощряет жестокость и насилие, что порождает самые жуткие аллюзии на «Терминатора». На самом деле разработчики автопилота используют лишь детальный движок GTA5 для эмуляции дорожных ситуаций, чтобы не зацикливать программу только на «лабораторных» сценариях. Хорошая графика и близкая к реальной физика позволяют научить искусственный интеллект правильному распознаванию любых объектов и поведению в сложных ситуациях, от банальных до критических. Это не исключает обучения «на натуре», но можно представить, насколько быстрее и разнообразнее будет натаскивание нейронных сетей, подобных AlphaZero, на компьютерных стимуляциях. Тем более, такое обучение почти бесплатно.

Вы все еще уверены, что автопилот не для России, потому что у нас снег и не все знаки логичны? Я уверен, одним из этапов обучения будет езда по «слепому» виртуальному городу, где не видно ни разметки, ни знаков, а половина водителей пьяные.

Обучение на играх набирает обороты, причем иногда используются самые примитивные игрушки уровня Atari, где задача нейронной сети — быстро понять правила и достигнуть высшего уровня мастерства. Есть программные среды, состоящие из десятков подобных игр, в которых нейронная сеть учится гибкости. И, кстати, игру она воспринимает «по-человечески», то есть у нее есть только визуальная пиксельная картинка с монитора и доступ к стандартным органам управления — мышки, кнопкам или джойстику.

Хотя эксперты уверены, что искусственный интеллект еще долго будет слишком «узкоспециализированным» для вызова человеку, меня заботит вот какая мысль. Я не очень любил логические игры, но меня несколько раз по уши засосало в военные стратегии или игры типа SimSity. Позже, читая о баталиях, я находил массу параллелей с играми, которые пусть с некоторой условностью, но воспроизводили реальность. В хорошей военной стратегии вполне можно научиться оптимально распределять ресурсы, вычислять наиболее вероятный ход противника, организовывать снабжение армии…

Отсюда вопрос: что будет, если AlphaZero пару месяцев поиграет сама с собой в лучшую военную стратегию, которую можно купить долларов за 100?

Клапауций думал, думал, аж сморщился весь, и сказал:
— Ладно. Пусть будет о любви и смерти, но все должно быть выражено на языке высшей математики, а особенно тензорной алгебры. Не исключается также высшая топология и анализ. Кроме того, в стихах должна присутствовать эротическая сила, даже дерзость, но все в пределах кибернетики.
— Ты спятил. Математика любви? Нет, ты не в своем уме… — возразил было Трурль. Но тут же умолк враз с Клапауцием, ибо Электрибальд уже скандировал:

В экстремум кибернетик попадал
От робости, когда кибериады
Немодулярных групп искал он интеграл.
Прочь, единичных векторов засады!

Так есть любовь иль это лишь игра?
Где, антиобраз, ты? Возникни, слово молви-ка!
Уж нам проредуцировать пора
Любовницу в объятия любовника.

Полуметричной дрожи сильный ток
Обратной связью тут же обернется,
Такой каскадной, что в недолгий срок
Короткой яркой вспышкой цепь замкнётся!

Ты, трансфинальный класс! Ты, единица силы!
Континуум ушедших прасистем!
За производную любви, что мне дарила
Она, отдам я Стокса насовсем!

Откроются, как Теоремы Тела,
Твоих пространств ветвистые глубины,
И градиенты кипарисов смело
Помножены на стаи голубиные.

Седины? Чушь! Мы не в пространстве Вейля
И топологию пройдем за лаской следом мы,
Таких крутизн расчетам робко внемля,
Что были Лобачевскому неведомы

О комитанта чувств, тебя лишь знает
Тот, кто узнал твой роковой заряд:
Параметры фатально нависают,
Наносекунды гибелью грозят.

Лишен голономической системой
Нуля координатных асимптот,
Последних ласк, — в проекции последней
Наш кибернетик гибнет от забот.

Нейронные сети. Пугающий пример: Один комментарий

  1. балканский гость 09.06.2018 — 00:03

    Да уж,если ИИ не может сказать, что истину искал, но прокляли его, или понимание «Шах-наме» для ИИ отлично от мнения «обыкновенного смертного» то, наверное, можно сказать о каком-то шансе на успех, т.е. о полном провале.

    Нравится

Оставьте комментарий

Создайте подобный сайт на WordPress.com
Начало работы
search previous next tag category expand menu location phone mail time cart zoom edit close