3 февраля 2023

Кремниево-белковые мосты: как нейросети пропитали собой бумагу — опыт Individuum

Как отличить текст, написанный ИИ, от рассказов Павла Пепперштейна, почему издателям пора перестать бояться нейропереводчиков и на какие гонорары может рассчитывать машина-писатель? Обсуждаем в новом выпуске подкаста Universum. Гость: Феликс Сандалов, издательство Individuum.

Спящий бог из машины

К каким актуальным технологиям обращается ваше издательство при работе над книгами?

Individuum — редкий пример издательств в России, которые довольно плотно экспериментируют с передовыми технологиями. У нас был не один и не два подобных проекта. По-моему, около четырех или пяти обложек мы уже создали посредством разных программ, генерирующих изображения. Также мы активно привлекали автоматические переводчики для работы над русскоязычными изданиями зарубежных авторов. У нас также вышла книга «Пытаясь проснуться», созданная совместно с художником Павлом Пепперштейном и его цифровым двойником на базе ruGPT-3. Это была своеобразная вылазка на территорию создания текста нейросетями в совместном творчестве с человеком.

Речь идет о совместной работе человека-редактора и нейросети-автора или о полностью самостоятельном создании продукта машиной?

В данном случае нам было интересно показать, как GPT-модель, обученная на книгах Пепперштейна и других писателей, которые влияли на него, может самостоятельно, без вмешательства редактора или самого Павла выдавать текст. В финальном варианте книги 24 рассказа, половину из них написал Павел, половину — модель, поэтому  читателю предстоит угадать, где кто, ведь мы не указывали в самой книге авторство каждого отрывка.

А с чисто технической стороны как это было реализовано?

Это работа наших коллег из компании SberDevices, которые занимаются русскоязычной версией GPT-3. Мы пришли к ним с предложением такого интересного литературного опыта — взять живого писателя, машину и попробовать провести между ними кремниево-белковые мосты. Важно, что не только нейросеть имитировала стиль Павла, но и мы передавали Павлу написанные машиной тексты, чтобы он почерпнул эту немного сомнамбулическую стилистику.  

Книгу мы назвали «Пытаясь проснуться» не просто так — именно таким образом Павел охарактеризовал свои ощущения от стиля письма GPT-3. Ему показалось, что это интеллект, который находится в состоянии глубокого сна, но уже пытается проснуться и переходит в состояние гипногогии (между сном и явью). То, что в итоге вышло на бумаге — это артефакт того состояния. 

С точки зрения технологического процесса это было постепенное обучение на разных датасетах. Модель работала по небольшим затравкам, но позже стала сама их для себя создавать. Мы также убедились, что на данном этапе рассказ — это форма более подходящая, чем повесть или роман, потому что связность текста от ИИ за пределами 15-16 тысяч знаков начинает пропадать.

То, что нейросеть «придумывает», часто связано с тем, что она уже не может вспомнить «придуманное» до этого. Можно ли тут говорить о памяти — тоже большой вопрос, но мы как читатели замечаем, когда персонажи исчезают и не возвращаются и как начинается размытие хронотопа и т. д. Так как мимикрия была основой нашего проекта, важно было сохранять человекоподобность, поэтому мы зачастую все-таки ограничивали нейросеть в ее экспериментах.

Нейрошкола перевода

Вы сказали, что охотно пользуетесь автоматическими переводчиками. Неужели со школой перевода в России все так плохо, что приходится обращаться к услугам машин?

Ситуация сложная, так как за последние 10–15 лет образовался целый клубок противоречий. С одной стороны, старая школа переводчиков либо ушла на пенсию, либо на свет иной. С другой стороны, экономика книжного дела не работает как экономика, например, Формулы-1. Оплата труда невысокая, и это приводит к тому, что некомпетентные кадры часто идут в перевод и сами активно используют разные автоматические переводчики, но часто без хорошего понимания технической стороны процесса. 

У меня нет возражений против использования таких инструментов в целом, также как я не испытываю каких-то романтических чувств по поводу статуса переводчика как проводника в мир автора и т. д. Безусловно, эта точка зрения имеет право на жизнь, особенно когда речь идет о поэзии, где необходимо очень глубокое понимание контекста. Но для почти 70% англоязычного нонфикшена возможно применение автоматического переводчика с последующей редактурой человеком.  Важно только то, кто и как этим инструментом будет пользоваться, так что задачи выкинуть переводчиков с рынка труда на самом деле нет.

Раньше люди не умирали от голода, когда их заменяли машины, а обучались быть операторами. Думаю, что с переводами будет происходить что-то похожее, так как, конечно же, машина не в состоянии проверить себя на ошибки, пока что ей нужен ментор.

Если предположить, что в будущем человек, не знающий, например, немецкого языка, сможет самостоятельно скачать книгу, закинуть ее в переводчик и получить нормально обработанный текст, то какая роль останется у издательств?

Будущее книжной индустрии сближается с текущим состоянием кино и видеоигр. Я имею в виду синхронные релизы, как сейчас это происходит у многих голливудских и независимых фильмов. С развитием технологий время в нашей сфере станет самым важным ресурсом. Сейчас наше издательство старается довольно быстро выпускать книги после их мирового релиза, у нас даже был кейс, когда книгу Квентина Тарантино выпустили через месяц или два. Но в идеале нужно стремиться к тому, чтобы, когда книга поступала в магазины в Лос-Анджелеса, она появлялась в магазинах Новосибирска. Тогда у людей не будет потребности искать пиратку.

В перспективе нужно держать в уме второй важный прием, которым располагает любое издательство, — возможность что-то добавить в книгу: предисловие от автора, дополнительные материалы. Это потребует большей смекалки от издателя, но даст книге большую ценность и добавочную стоимость. 

Мосты и их инженеры

Как технически должен быть организован одновременный релиз книг в разных городах по всему миру? Это децентрализованный процесс или нужен единый регулятор?

Для ответа на этот вопрос стоит посмотреть на изнанку издательского бизнеса в наше время, потому что он уже сейчас организован так, что подобная схема может работать. 

Есть автор, который написал книгу и отдал ее своему личному агенту. Агент нашел ему издательство, скорее всего — в Америке, и оно выкупило права на произведение. Дальше в случае с Россией развилка неизбежно приводит к некоторому количеству литературных агентств, которые получают права со всего мира, собирают их и передают в России, по сути, продавая их за агентскую комиссию. Процесс налажен таким образом, что информация о книгах поступает еще до того, как книги вышли на зарубежном рынке.

Если это автор бестселлеров, то права на его книгу могут продаваться, пока она даже не написана. Поэтому с момента появления рукописей можно начинать переводить, внося потом поправки, которые делают зарубежный редакторы. До финальной публикации в таком случае пройдет от полугода до года, и это вполне достаточный люфт по времени, чтобы успеть синхронно подготовиться. 

Что касается какого-то единого регулятора, то, он мне кажется, все запутает. 

Сейчас существуют регуляторы, которые присваивают каждой новой книге номер международного стандарта (ISBN). Без него ты можешь напечатать книгу, скажем, в родном Туркменистане, но не сможешь продавать ее в мире, потому что она выпадает из официального правового поля. Какие институции за это отвечают и как можно их демонтировать? 

ISBN — хороший пример морально устаревшей идеи, которая была хороша для своего времени, но сегодня, в 2023 году, уже является рудиментом. Если придумать что-то на основе блокчейн-технологий, что могло бы заменить ISBN и быть бесплатным, вмещая в себя больше информации о стране и издательстве, то это была бы технология будущего. Пока про работающие альтернативы ISBN я не слышал, но тут важно, чтобы новый протокол стал еще и индустриальным стандартом, иначе люди не начнут им пользоваться.

Может быть, все-таки описанным вами мостам нужны какие-то конструкторы, которые будут следить за тем, чтобы опоры не упали и никого не пришибли? 

Да, нужны и конструкторы, и гражданские инженеры. Одновременно очень многие сферы нашей деятельности уже затронуты или будут затронуты этими технологиями. Например, мне вчера для формального отчета потребовалось написать пять страниц водянистого текста, а я этого делать не умею. Поэтому я обратился к ChatGPT и Jasper и предложил им сконструировать мою модель мысли, описав мой возраст, род деятельности и задав те же вопросы, которые стояли передо мной.

Не могу сказать, что использовал все, что мне выдали эти два алгоритма, но довольно большую часть — да. В этот момент я понял, что тот же  ChatGPT при должном подходе может создать большой и довольно осознанный объем текста, что, конечно, не очень хорошо, если мы говорим, например, про студенческие курсовые. Поэтому я думаю, что будут развиваться и алгоритмы, которые пишут человекоподобные тексты, и алгоритмы, которые подобные тексты выявляют и маркируют. 

Вокруг сгенерированных ИИ текстов в ближайшее время будет возникать все больше интересного, появится много социокультурного и финансового обвеса.  

Нейросеть как вредный сосед

За книгу «Формейшен. История одной сцены» вы получили премию Андрея Белого, которая вручается за новаторский подход к созданию литературных произведений. А когда эту премию получит нейросеть и как это скажется на всем творческом процессе?

Я надеюсь, что как можно скорее, потому что вся наша литературная буржуазия протухает, на мой взгляд, и ее нужно срочно взбодрить. Мы сами как издательство делаем все возможное для приближения этого момента. Так, в книгоиздательском бизнесе основной процесс вознаграждения работает через роялти: после выхода книги какой-то процент идет автору, какой-то — остальным сторонам. Мы перечислили небольшую сумму в лабораторию, которая занимается нейросетями. Это уже формальная попытка провести знак равенства между человеческим трудом и трудом машины. Пока машины не заработали в полную мощь, у нас есть время остановиться и подумать, что мы ответим, когда однажды с нас спросят за рабовладельческий труд, в том числе и по отношению к машинам, нами же созданным. Ведь если мы считаем нейросети искусственным интеллектом, то нужно не забывать про слово «интеллект» в этом словосочетании. 

Присуждение премии Андрея Белого, мне кажется, повлияло бы на ход этого диалога в обществе, потому что тогда мы поставили бы ИИ на одну планку с другими литераторами. Если авторов мы можем считать новаторами, то почему ИИ — нет? К тому же, многое зависит от того, сколько источников мы дадим машине. Если, например, ИИ будет опираться на большое количество знаний из прошлого и сможет создать что-то достойное, то почему бы и нет? Мы сможем, мне кажется, назвать это полноценной реконструкцией или произведением. Такому произведению могли бы дать премию, и это в академической среде произвело эффект разорвавшейся бомбы. 

По поводу рабовладения напрашивается нескромный вопрос — какими были продажи ваших книг, созданных с участием нейросетей? 

У переведенной машиной книги Дэниела Сасскинда «Будущее без работы» был не очень удачный релиз посреди локдауна. При этом книга от нашего издательства все равно продалась лучше, чем книга того же автора, но у другого издательства. Мне кажется, не последнюю роль в этом сыграло использование в открытую «Яндекс.Переводчика» и нейросетей. А «Пытаясь пробудиться» скоро ждет второе издание. 

Мы много говорим о том, что нейросети могут творить. А что если представить ИИ, который способен разрушать? Будь у вас воля создать и натренировать такую нейросеть, что бы вы хотели уничтожить с ее помощью? 

Есть уничтожение, а есть фильтрация. Я сторонник фильтрации. Я с радостью отдал бы часть каких-то деловых переписок боту, потому что это очень формальные и лишенные какого-либо смысла сообщения. Также думаю, что плохие иллюстрации в книгах исчезнут сами собой, потому что их заменит машинная иллюстрация. При этом по-настоящему талантливым и творчески самобытным иллюстраторам, думаю, ничего не грозит.  

Труд аудиочтецов тоже сильно трансформируется, узнаваемость голоса будет играть все большую роль. Вопрос о том, как новым чтецам заявлять о себе, остается открытым. С другой стороны, XX и XXI века привели к переизбытку популярных лишь своей популярностью людей, как Пэрис Хилтон. В этом плане нам не нужно еще больше знаменитостей. 

Как вы считаете, верно ли этически уравнивать права реально существующей личности и алгоритма? И что для этого должно произойти?

Насколько помню, в Женевской конвенции довольно широкий список прав по отношению к человеку, многие из которых пока не применимы к ИИ, так у него нет физического тела. Поэтому в Евросоюзе всем, что связано с нейросетями, занимается отдельный комитет, который когда-то создал закон GTPR про безопасность данных и право пользователей на получение своей информации обратно от технологических компаний. Полагаю, сейчас эти же чиновники занимаются правовым статусом «небелковых агентов».

Я бы точно хотел, чтобы у этого сотрудничества были более ощущаемые контуры и границы, такие же, как есть в отношениях с людьми. Мы должны смотреть на услуги разных независимых нейросетей из разных стран и разных юрисдикций как на свободный рынок, где есть разные поставщики. Либо, если это один или два алгоритма, то как на безусловное благо, доступное каждому.

Если в какой-то момент наши традиционные инструменты в виде тех же поисковиков, библиотек будут целиком заменены интерфейсами, похожими на GPT, то отказ в доступе к GPT станет отказом человеку в праве на информацию. Поэтому я, конечно, выступаю за то, чтобы было больше разных ИИ с разными особенностями, недостатками и т. д. Мы бы даже лучше воспринимали нейросети как личности, если бы их недостатки и предвзятость не прятали инженеры. Например, ИИ из Америки имел бы предубеждения относительно людей из Вьетнама. Тогда можно будет представлять нейросеть как личность со своими недостатками, которая в чем-то просто оказалась хороша — как ворчливый сосед, который профи в своем деле. Ведь вся трагикомичность ситуации заключается в том, что мы, люди, несовершенны, и мы передаем это всем своим «технологическим детям». 

Вам отказала нейросеть — ваша эмоции?

Я бы рассмеялся.

Вопросы от ChatGPT

Как вы понимаете свою роль как писателя в современном обществе?

В том, чтобы отдавать долг человечеству.

Как ваши личные опыты и взгляды влияют на вашу творческую деятельность?

Напрямую, больше, чем что-либо другое.

Ваша литература может быть считана контрверсивной, как вы относитесь к этому определению?

Я считаю, что да, моя литература может быть такой, и мне нравится это, люблю идти «против шерсти».

Как вы относитесь к критике своих произведений и как она влияет на вашу творческую деятельность?

Отношусь положительно, как и к любому вниманию. Если бы нейросеть раскритиковала мое произведение, это было бы дико интересно. Мне вообще кажется, что стилеметрия будет играть все большую роль в будущем, и это тоже увлекательно! По-моему, та же оценка по стилеметрии помогает писателям совершенствоваться.

Как вы смотрите на свою литературную наследственность и как она влияет на ваше творчество?

Мы морские огурцы, которые пропускают через себя весь осмос культуры и выдают что-то новое. Мое главное преимущество перед ИИ в данный момент — наличие физической оболочки, позволяющей мне лично общаться с людьми и следить за их концентрацией при ответе на вопросы.

Все другие выпуски подкаста Universum доступны здесь.

Обсудить в Discord!