29 сентября 2020

Путь к дружелюбному ИИ: чем занимается организация OpenAI

Создание общего искусственного интеллекта, который по уровню развития будет сопоставим с разумом человека – это общая цель всех исследователей мира. Однако многие из них считают, что самореплицирующийся ИИ сможет навредить человечеству больше, чем помочь.

Именно на этой волне противостояния мнений о пользе и вреде искусственного интеллекта, Илон Маск, известный по проектам SpaceX и PayPal, совместно с президентом венчурного фонда Y Combinator Сэмом Альтманом создал в конце 2015 года некоммерческую организацию OpenAI. Ее цель – развивать открытый и дружественный искусственный интеллект, работающий на благо человечества, а не государство или корпорации.

На данный момент в компании работает около 50 сотрудников. За пять лет работы, они создали 40 проектов в разных областях науки о данных, многие из которых получили мировую известность. О них мы сегодня и поговорим.

OpenAI Gym

В апреле 2016 года компания представила набор инструментов для разработки и сравнения алгоритмов обучения с подкреплением Gym. Он не делает никаких предположений о структуре агента и совместим с любой библиотекой численных вычислений, такой как TensorFlow или Theano.

Наборы тестовых задач в Gym называются средами, которые разработчик может использовать для отработки алгоритмов обучения. В Gym их сотни, от простых до сложных и включающих множество различных типов данных. Инструмент поддерживает четыре вида сред: классический контроль, алгоритмические среды, окружение Atari, а также 2D и 3D роботы. Классический контроль и игрушечный текст предназначены для выполнения небольших задания. Алгоритмические среды созданы для выполнения вычислений, таких как добавление многозначных чисел и изменение последовательностей. Среды Atari позволяют обучать алгоритмы в классическом окружении культовых видеоигр 80-х годов. 2D и 3D роботы среды созданы для управления роботами в симуляции. В этих задачах используется физический движок MuJoCo, который был разработан для быстрого и точного моделирования роботов.

Среда Humanoid-v2 для обучения двуногого робота в трехмерном пространстве идти вперед как можно быстрее не падая

 

Во всех средах поддерживается обучение с подкреплением. В OpenAI уверены, что именно данный тип обучения моделей искусственного интеллекта достигать хороших результатов во многих сложных условиях. Однако в компании отмечают, что исследования обучения с подкреплением тормозятся такими факторами, как потребности в качественных тестах результатов обучения и отсутствием стандартизированных сред.

OpenAI Five

Впервые В 2017 году СМИ снова заговорили об OpenAI, когда разработанный алгоритм компании обыграл профессионального киберспортсмена в популярной MOBA видеоигре Dota 2 в режиме 1 на 1. Бот, который назвали OpenAI Five, обучался, играя против себя в течение двух недель в реальном времени.

OpenAI Five против профессиональных игроков Dota 2

 

OpenAI выбрали систему «обучением с подкреплением», так как боты со временем учатся, играя против себя сотни раз в день в течение месяцев, в течение которых они получают вознаграждение за такие действия, как убийство врага и разрушение башен.

К июню 2018 года возможности ботов расширились: теперь они могут играть в команде из пяти человек и побеждать команды любителей и полупрофессионалов. На The International 2018, ежегодном соревновании профессиональных киберспортсменов в Dota 2, OpenAI Five провела две игры против профессиональных команд: одну против бразильской paiN Gaming и другую против звездной команды бывших китайских игроков. И хотя боты проиграли оба матча, OpenAI по-прежнему считали это успешным экспериментом, заявив, что игра против некоторых из лучших игроков Dota 2 позволяет им анализировать и корректировать свои алгоритмы для будущих разработок.

Финальная публичная демонстрация ботов состоялась в апреле 2019 года, где они выиграли серию из трех побед против чемпионов The International 2018 на живом мероприятии в Сан-Франциско. В том же месяце состоялось четырехдневное онлайн-мероприятие по игре против ботов, открытое для публики. Там боты сыграли в 42 729 публичных матчей и победили в 90% из них.

Очевидно, разработчики OpenAI Five довольны достижениями своих ботов. Однако в компании отметили, что не планируют оставлять алгоритм в открытом доступе, так что сыграть против ботов все желающие не смогут.

GPT-3

Generative Pre-trained Transformer 3, или GPT-3, является одной из последних разработок OpenAI. Это языковая модель третьего поколения в серии GPT-n, которая использует глубокое обучение для создания текста, похожего на тот, что создал человек. Полная версия алгоритма имеет 175 миллиардов параметров машинного обучения. GPT-3 был представлен в мае 2020 года, а с июля 2020 года находится в стадии бета-тестирования. До выпуска GPT-3 самой крупной языковой моделью была Microsoft Turing NLG, представленная в феврале 2020 года, с емкостью 17 миллиардов параметров, что в десять раз меньше по сравнению с разработкой OpenAI.

Качество текста, созданного GPT-3, настолько высокое, что его трудно отличить от того, что написал человек. Тридцать один исследователь и инженер OpenAI,  когда представили GPT-3, предупредили о потенциальных опасностях алгоритма и призвали исследователей не злоупотреблять возможностями модели.

В своих обзорах, технологические СМИ ужаснулись возможностям GPT-3. Так, колумнист The New York Times Фархад Манджу сказал, что алгоритм, который может генерировать компьютерный код, поэзию и прозу, не просто «удивительный», «жуткий» и «унизительный» , но также «более чем устрашающий». В обзоре Wired говорится, что GPT-3 «вызывал озноб в Кремниевой долине». В статье MIT Technology Review отметили, что алгоритм понимает мир неверно и доверять тому что он говорит нельзя. По словам авторов статьи, GPT-3 моделирует отношения между словами без понимание значения каждого слова.

Тем не менее, GPT-3 произвел настоящий фурор в интернете. Так, The Guardian «попросили» алгоритм написать эссе на тему, почему ИИ не угроза для человечества. Эссе быстро распространилось по сети, его перепечатали сотни СМИ, а в социальных сетях до сих пор спорят по поводу его содержания. Разработчики нашли и другое применение алгоритму: они учат его верстать макеты в Figma и писать код на Python по текстовым комментариям.

22 сентября 2020 года стало известно, что Microsoft лицензировала «эксклюзивное» использование GPT-3, но при этом независимые исследователи по-прежнему могут использовать общедоступный API для получения вывода. Согласно соглашению только Microsoft имеет контроль над исходным кодом.

Будущее OpenAI и ее разработок

Всего за пять лет OpenAI совершила невероятное. Им удалось научить ботов обыгрывать людей в одной из самых сложных видеоигр и генерировать качественные тексты. И это далеко не все, что делала компания. Их разработки касаются практически каждого аспекта, который охватывает сфера искусственного интеллекта. И на этом этапе остается открытым главный вопрос: удастся ли OpenAI сохранить свою независимость от корпораций и государства?

Эксклюзивное лицензирование GPT-3 крупной технологической корпорацией поднимает этот вопрос на совершенно новом уровне. Илон Маск раскритиковал этот шаг. По мнению Маска, компания отступила от идеи открытости, по сути, захвачена Microsoft. Но что с этого получится мы узнаем лишь спустя время.

Обсудить в Discord!